Si vous avez des astuces pour m'aider à optimiser encore plus, je suis preneur ! Merci à Propulse by CA de me permettre d'y voir plus clair dans mes comptes en m'ayant permi de créer un compte pro chez eux. Profitez d'un mois gratuit pour essayer la plateforme via ce lien : bit.ly/BenjaminCodeLePlusBelEtreHumainDeLaTerre (je trouve le lien assez stylé perso...)
réduit le prix, qui payera 100€ pour n'importe quel service à part semrush éventuellement? avec du volume tu gagnera beaucoup plus. De plus si tu offre une verssion limitée freemium ça va permettre aux gens de tester avant de s'abboner, j'étais prêt à m'abboner mais lorsque j'ai vu le prix j'ai fait marche arrière directement.
Il manque pas mal d'infos pour des idées d'optimisations. Mais ce qui me vient en tête : * Est-ce que tu récupères bien uniquement les vidéos avec placement signalé via l'API youtube (videoPaidProductPlacement) ? * Pourquoi est-ce que tu checkes chaque jour les youtubers alors que souvent ils postent a intervales réguliers. Une petite étude sur la fréquence de publication, et tu ne checkes plus que sur une période optimale (surtout que je ne pense pas que la valeur ajoutée de ton service soit d'avoir des données à jour à l'heure près). * Est-ce que tu pré-filtres les vidéos par nombre de vues , ancienneté de la chaine, nombre de likes, nombre d'abonnés, durée, ... pour éviter de faire tourner tes algos sur des vidéos qui n'ont aucune chance d'être sponso ? * Est-ce que étudies la diversité des sponsors par chaine, et ou la fréquence de sponso pour une chaine afin modifier la fréquence des checks sur cette chaine ? * Est-ce que tu as un système de blacklist pour les chaines qui ne peuvent absolument pas être monétisées ? * Est-ce que t'as fait l'étude cout d'un crédit RU-vid vs prix de passer par tes algos pour être certain que c'était rentable de pas faire des call en plus ? * Est-ce que tu as créé plusieurs comptes Google pour changer ta clé API et multiplier les quotas gratuits RU-vid ? * Est-ce que tu passes par la détection de mots clés ou d'url dans le transcript et|ou description de la vidéo pour récupérer les liens vers les sites des sponsors et codes promos pour t'éviter de passer par chatGPT + vérification de l'existence d'une société ? * Est-ce que tu checkes dans les commentaires si l'auteur a épinglé un commentaire avec potentiellement un lien ? * Est-ce que tu as testé www.pappers.fr/api pour récupérer les infos des entreprises ? ...
J'ai l'impression aussi que tu pourrais scrapper directement les pages youtubes pour récupérer certaines infos. Genre, si y a un "paidContentOverlay" dans la page single, ou sur d'autres balises sur les pages de recherches ...
J’suis désolé mec mes j’ai vue @cocadmin faire la même choses et proposer du travail juste une semaine après le lancement du même service que le tien et eux ils sont plusieurs ……
En toute sympathie : Attention au syndrome du perfectionniste, il semblerait que tu passes du temps à vouloir créer un produit parfait, avec de nombreuses fonctionnalités, une dimension internationale, avant de faire la chose essentielle au développement d’un boîte : valider le product market fit en trouvant des clients (peut-être que je me trompe et que tu en as plein et dans ce cas, content pour toi 😁)
C'est trop bien que tu partage tes "erreurs" et les aleas liés à ton Saaa. Ca change de toutes les success story qu'on voit d'habitude, sans aucun contexte, sans détail. Continue comme ca, tu vas tout déchirer quand tu seras prêt à ouvrir au RU-vid anglophone
My 2 cents: pour la limite 10k crédit de l api RU-vid, pourquoi ne pas réduire la fréquence de scrapping Pour les meilleurs chaînes, tu restes en daily et pour les chaînes middle tu scrappes tous les 2 jours et pour les petites chaînes tous les 3 jours Faut adapter par rapport aux besoins Tu pourrais même juste scrapper tous les jours par rapport aux listes d’intérêt des users et updater une fois par semaine (ie scrapper 1/7 du groupes tous les jours) les autres chaînes
C'est motivant de te voir réussir et le fait que tu explique les backstages de ton projet, en tant que développeur ça me donne vraiment envi de tenter l'aventure, mais n'ayant pas autant de visibilité que toi, pour le moment je développe des softs Free et OpenSources pour me constituer une communauté et gagner en visibilité. En tout cas, je sors de la communauté silencieuse qui te suit pour te remercier car toutes tes vidéos sont vraiment encourageantes et donne beaucoup de bonnes idées 😁 Donc Merci !
Ça fait plaisir de voir qu'en tant que créateurs de SaaS, on a tous les même types de problèmes ahah. Entre les services externes fiables / pas fiables, les coûts associés à ces derniers qu'il faut maîtriser, les maj impromptues qui foutent en l'air tous tes systèmes en place... Bravo en tout cas, hâte de voir la suite 💪
Pour ton dataset crunchbase, juste scrap le une bonne fois pour toute. Certes tu auras pas les "nouvelles boites " mais le mettre à jour 1 fois tous les 6 mois puis plus fréquemment ça me semble pas totalement débile.
Je pense que t'as pas besoin de fine tune llama3 pour que ca fonctionne bien pour détecter, même le petit fonctionne super bien. Aussi, si t'as un server avec llama3, tu peux t'en servir pour beaucoup d'autres choses (exemple proposer la redaction de mails aux sponsors avec le profil du user et le profil du sponsor, pre rediger des présentations de sponsors, ...) Tu devrais travailler des prompts avec llama3 et tu devrais avoir des trucs pas mal
Pour détecter les sponsors tu pourrais utiliser la techno de SponsorBlock et puis une fois le passage cut pourquoi ne pas simplement faire un speech to text et un image to text du passage de la sponso pour retrouver le nom de marque le plus répété dans le passage
Super vidéos, Benjamin. Je me suis reconnue dans ton cas concernant les frais de serveur, ah ah. J'ai fait une gaffe sur mon AWS Lambda pour mon SaaS, ce qui a fait monter la facture à 2000 $ au cours des 30 derniers jours. Et le truc qui me fait le plus mal, c'est qu'au début je vérifiais les frais qui semblaient corrects et stables. Alors j'ai arrêté de regarder pendant 2-3 semaines, et entre-temps, l'application a augmenté en utilisateurs et j'ai eu une montée en charge anormale sur mon Lambda, faisant monter ma facture à 250 $ par semaine 😭. Quand j'y pense, j'ai vraiment mal ^^, mais autant en rire. J'ai contacté AWS pour parler de cette hausse anormale... priez pour moi.
Curieux de comprendre comment tu as atteint 2000$ en lambda. Franchement, faut déjà y aller ... Combien d'invocations par mois ? durée moyenne de vos lambda ?
@@jean-louisgouwy En faite J'ai discuté avec le service client à ce sujet, et ils m'ont dit que j'avais utilisé environ 53 millions de GB sur mon Lambda, d'où cette augmentation. Pourtant, mon application n'a pas autant d'utilisateurs. Je suis en train de discuter avec eux pour obtenir au moins un remboursement partiel sous forme de crédits AWS, car j'ai dû payer 1000 euros hier pour éviter que mon compte AWS ne soit bloqué, avec les données des utilisateurs sur un S3 que j'utilise et qui me coûte environ 70-80$ par mois (ce qui est correct). Il reste encore 1000$ à régler dans les semaines à venir. Si vous avez des conseils en termes de négociation avec Amazon pour ce genre de cas, je suis preneur. Car je pense que je me suis peut-être fait DDOS ou autre. Suite à cette gaffe, j'ai complètement revu la structure de mon app pour limiter la casse et ça commence à se stabiliser en termes de frais Lambda par jour. J'ai vraiment le sum.
@Benjamin ! J'étais dans la meme panade avec les noms d'entreprises ! La meilleure solution pour commencer : télécharger un csv avec pleins d'entreprises existantes, les checker une à une. Après tu es sûr et ça te coutera plus rien.
Bonjour, Je postule au poste de human checker pour l'ouverture UK et Es! ❤ Excellente vidéo très instructive qui j'espère évitera à beaucoup dont moi de faire des erreurs. 😅
j'adore ce contenu de vidéo, personnelle pour réduire le coût humain, j'aurais créer un base de donnée qui quand le robot découvre une nouvelle boite ou sponsor, elle s'ajoute dans la base de donnée et de ton côté tu as un dashboard qui liste toutes ses nouveaux sponsor avec des actions d'ajout automatique quand tu valides que le faite que le sponsor existe. Après c'est rien que mon avis perso. Sinon vidéo géniale, j'espère que tu réussira à garder ton SaaS le plus long temps ouvert.
Super vidéo comme d'hab ! ptite question t'as essayé avec chat gpt-4o qui est dispo depuis peu ? apparemment les coups sont bcp moins cher genre 10x moins cher jcrois...
J'adore cette "Arc" où tu t'occupes de ton SaaS, merci pour ces vidéos ! Sinon question à part, tu utilises quel thème sur ton éditeur ? il à l'air sympa
Tu devrais passer à l'étape supérieur, faire une levée de fond pour financer les API, peut-être embaucher quelqu"un d'autre avec toi pour avancer encore plus vite et surtout, surtout blinder la phase marketing, c'est le plus important. En tout cas très beau projet je te souhaite le meilleur pour la suite
Au regard des commentaires, je pense qu'il serait intéressant pour toi de t'entourer de spécialistes métiers, notamment des architectes logiciels et des AIOps, pour concevoir une solution scalable et anticiper de nouvelles fonctionnalités. Après, les coûts opérationnels ne sont pas vraiment énormes. Tiens, je propose une fonctionnalité : segmenter tes créateurs et proposer une catégorie "pépite", de créateurs avec relativement peu d'abonnés mais du contenu de top qualité et/ou rare. Pour les annonceurs qui veulent s'inscrire dans la durée et être des dénicheurs de talents. (Un truc que je fais souvent est de rechercher de nouvelles chaînes sur des thématiques données ou des vidéos ultra de niches et j'ai pu découvrir des créateurs un peu avant tout le monde , dont toi 👍)
Merci pour ton partage ! C'est très chouette d'en savoir plus sur l'arrière-boutique (et merci à ton frère!) Question candide : comment sais-tu que le sponsor valide un jour le restera la semaine prochaine ou l'année prochaine ? autrement dit, comment ta base de données reste à jour dans le temps ?
Je trouve sa bien compliqué pour ce est, en gros, un annuaire. Si le besoin est réelle pourquoi ce n'est pas directement les youtubeurs et les marques qui créer leur profil. Et ton SaaS serait l'intermédiaire de confiance qui vérifie et filtre en amont.
@BenjaminCode Go hébergez un modèle Mistral toi-même, tu économiseras énormément de coups de tokens et tu pourras entraîner le modèle seulement sur les utilities que tu utilises. Le modèle de Mistral est aussi puissant que ChadGPT 3.5 Turbo et une nouvelle version au moins équivalente à ChadGPT 4 devrait arriver très prochainement. L'auto hébergement de Mistral sur Hostinger fonctionne très bien. Et cerise sur le gâteau, c'est une solution française.
As-tu pensé à utiliser Groq avec llama3 70B ? Avec un peu de chance, le modèle est assez bon pour remplacer gpt-4, ce qui te coûterait beaucoup moins cher.
Top video. Tu attends que tout soit carré pour envoyer la sauce au marketing ? Parfois on a tendance à trop repousser cette partie là, pourtant vitale.
J’attends juste la partie internationale qui arrive. Autant les RU-vidrs français que étrangers, on va tous avoir besoin de cette partie la. Pas envie de commencer le marketing avant d’y être
Hello ! Petite question sur ta solution pour le scraping, car je me suis pas mal cassé les dents sur ça déjà ahah, est-ce que c'est une solution totalement custom à ton cas, ou c'est quelque chose qui pourrait servir en général ?
Coucou, sinon tu ne peux pas essayer de raffiner les données (un petit script Spark ça doit faire l'affaire, c'est pas compliqué) avant de les balancer sur chatGPT ? Bon faut l'infra derrière mais à cette échelle...
Tu n'as pas besoin de répliquer ce que fait un humain pour scraper. Si le site est une SPA et qu'elle a une API, il suffit de parser cette même API que tu peux voir dans l'onglet "réseau" de ton navigateur. Pour RU-vid, tu peux créer plusieurs clés (comptes) et les utiliser en mode micro-service. Pour l'IA, tu as Groq qui tourne sur Llama 70b. Tu peux parser la description pour prendre le sponsor et suivre le lien (ping) pour vérifier s'il existe. (Et c'est gratuit... pour l'instant.) (hope it helps)
Hello ! Ta solution pour le scrapping, (parser là même API) je ne crois pas qu'elle marcherait si l'API est protégée par CORS (ce qui est le cas par défaut chez la plupart des framework (Laravel, etc...) ) Ou bien , tu crois que c'est possible de contourner ça aussi ? PS : merci pour l'info sur Groq, ça peut m'aider (depuis le temps que je cherche une API gratuite pour faire des petits projets AI)
Salut Benjamin, pour le scraping javais eu le même soucis avec leboncoin (javais créé un serveur qui me notifiait sur télégram dès qu'une annonce correspondait à ce que je cherchais à l'époque, je passe le details du pourquoi, c'était plus puissant que leur notifs intégrées ^^), et pour bypasser les capcha j'utilisais le reseau tor, sinon au bout de quelques refresh même randomisés en timing, l'ip se faisait strike. Seul bemol c'était la lenteur, mais si t'as pas besoin d'un truc ultra rapide, ça peut s'etudier
Pourquoi si tu recupere que le strict necessaire de crunch base, pourquoi tu n'utiliserais pas leur private api ils ne demande pas de token bcp + facile que insta x ...
J'ai jamais été emballé par cette idée de SAS. Depuis le debut, je ne crois pas vraiment a ton succés sur ce projet. Ca ne m'empeche de te suivre dans cette aventure, c'est super interessant de suivre l'evolution et ton parcours. Je te souhaite vraiment de me donner tord! Bon courage
Merci ! En vrai c’est cool comme retour ! Dans tous les cas c’est une aventure intéressante pour tout le monde. Moi je crois a l’idée donc on verra si jarrive a en tirer quelque chose. Ce qui pourrait être très intéressant pour moi c’est que tu m’expliques pourquoi tu n’y crois pas toi ! Ça se trouve ça me donnera des idées marketing intéressantes !
@@BenjaminCode je suis moins bien placé que toi pour avoir un avis pertinent, mais d'instinct je me dit que c'est un marché de niche et que le public visé n'est pas forcement tres regardant sur leur sponsoring ou a la recherche d'un tel outil.
@LilScrappy94000 c’est un marché de niche mais tkt que si tu dis a 350k personnes qu’ils peuvent maximiser leur revenu en trouvant plus de sponsors potentiels, y’en a bien quelques qui seront prêt a débourser l’abonnement ! De plus coté marque, c’est une énorme tannée de trouver des influencers en qui placer ta confiance. Les trouver facilement grâce a un tel outil c’est providentiel pour les marques qui sont prêts a lâcher pas mal de tunes pour ça ! C’est du B to B mom bazar donc t’as l’impression que y’a pas tant de clients potentiels mais y’en a pleiiiiin. Après c’est pas un saas dont ma commu est la cible mais ça c’est presque tant mieux en fait ! Comme ça je peux vous raconter l’histoire sans vouloir vous faire cracher du fric ce qui entretien une relation plus saine je trouve !
Très bonne vidéo ! Je me rendais pas compte des coûts que ce genre de projet peut avoir. Je me posais une question, au niveau légal, Crunchbase autorise, ou plutôt, n'interdit pas le scraping ?
Mais pourquoi ne pas scraper la base de données de l’extension chrome « Sponsor Block » car celles-ci contient avec précision toutes les parties sponsorisées des videos yt
Bonjour, j'ai un vps qui tourne sur almalinux avec un server apache dessus (sur hostinger) et j'aimerais déployer un application full stack dont front + back + bdd, pour le moment je n'ai réussi à déployer que le front ce qui est le plus simple, par contre je galère à déployer le back, faire les redirections d'url etc je n'y arrive pas, je précise que j'utilise virtualmin comme OS, est ce que quelqu'un aurait un tuyeau par hasard ?
Pour le serveur regarde du côté de contabo. Je dois payer environ 40$ pour un serveur virtuel 100% configurable ou je peut installer tout ce que je veux 👍 peut-être une solution pour installer ton système + un llama 😁
Et faire des tests auto avec en entré la liste des sponsores et tes tests auto vérifie tout ? ça fait dev ton frero c'est accessible et ça vous aidera beaaaucoup pour la sortie aux US
Tu peux faire aussi en mode tests auto API qui récupère ta liste de sponsors et de l'autre côté un appel API qui te retournes un JSON de tous tes users et tu fais les checks que tu veux. ça sera plus rapide que des tests manuels, ou encore auto en mode UI (du type Playwright)
salut benjamin, je t'ai decouvert ya pas longtemps grace a ton saas notamment, je voulais te dire felicitations a toi et continue comme sa, moi aussi je voulais coder un saas mais je ne sais pas comment m'y prendre (j'ai des bases en dev) dans la methodologie, est ce que sa serait possible de me recontactez en mp merci d'avance (j'ai 15 ans )
L'API RU-vid... On est ensemble x) Plus jamais je lance un truc basé sur RU-vid. Pour moi le quota d'API est pas suffisant, du coup je fais du scrapping, ce qui fonctionne mais arrive avec des problématiques différentes.
Utilise Mistral Ai, c'est 100 fois moins cher que Gpt 4, niveau installation avec l'api c'est similaire avec GPT, c'est français et surtout ça a un niveau de performance équivalent à Gpt 4 Si tu veux je t'envois une video de tuto pour installer l'api de maniere simple
Et j’aurais ce stress horrible de gérer moi meme ma data. La, mes données sont safe, répliquées, back up 3 fois par jour. Et de mon coté ça me permet d’avoir un projet stateless. En fait je peux nuke mes vps sans problème. Les changer a volonté sans soucis non plus vu que la data est ailleurs. Perso ça m’ajoute une bonne souplesse qui vaut largement les 20€ par mois que ça coutait (40 aujourd’hui mais ça reste ok)
J'ai pas trop compris la différence entre le travail de ton frère (qui est de vérifier qu'un nouveau sponsor est bien un sponsor) et la partie avec le scraping qui vérifie qu'un nouveau sponsor existe bien et qu'il s'agit bien d'un sponsor.
Cette partie la peut bien faire son travail en trouvant le bon sponsor d’elle meme et en scrap pant les infos, mais parfois elle se plante. Elle prend une marque qui a le meme nom mais qui n’a rien a voir avec la marque qui a sponsor le RU-vidr. Donc mon frère est la soit pour confirmer définitivement que ce sponsor a bien été scrappé et est bien le bon. Soit il doit aller chercher lui meme la vraie page de la marque et renseigner lui meme les infos si la marque n’est pas sur crunchbase par exemple. En gros il est l’ultime barrage qui assure que tous les sponsors présents sur le site sont des vrais sponsors cohérents qui font bien des opés sur RU-vid. Au début j’avais pas cette vérif humaine et donc j’avais beaucoup d’infos fausses dans la base. Et quand t’as des clients qui paient, ça la fout vraiment mal !
Tu devais en faire un produit, et vendre les donnée en one shot. Personne veut payer des abonnements, fournis aux gens la data et un visualiser sur un site web comme ça je penses que tu vas vendre. Les. Gens deviennes plus retissant aux abonnement
Yo ! C'est un repost de mon commentaire sur Twitter, mais j'aimerais vraiment savoir si c'est un truc utile ou pas : Premièrement, ca dégoûte comment tu cut sans dire l’astuce j’étais à fond pour savoir 🤣 Deuxièmement, et plus important : Quelqu’un la sûrement déjà suggéré, mais pourquoi tu essaies pas de choper des infos sur les prix des sponsorings des gens?? Pour moi la giga value de ton SaaS elle serait là ! Même si tu as pas l’info à chaque fois, ETQ petit RU-vidur, mon gros besoin c’est savoir combien Michel qui a 500 abos de plus que moi à pu demander au sponsors de ma niche Ou alors je suis le seul à me dire ça ^^?
Non c’est en effet une info intéressante mais c’est l’info la mieux gardée du monde. En fait contractuellement on n’a pas le droit de dire combien un sponsor nous a payé. Meme a nos collègues RU-vidrs. Donc si tu as cette info sur ton site, c’est que t’as des RU-vidrs qui ont pas respecté leur contrat… partant de là, je me dis que c’est une info impossible a avoir.
@@BenjaminCode Ah merde, je me disais que c'était pas toujours exclu, c'est un truc propre aux partenaires ou a RU-vid ? J'suis pas encore payable haha j'y connais rien ^^"
Intuitivement je me passerais de l'IA. Je chopperai le transcript avec youtube API et rechercherai les mots clés "notre sponsor", "sponsorisé par" etc... Après le lien du sponsor est souvent en description, donc assez facile à récupérer aussi
Ça peut être une approche intéressante oui ! Juste que si je dois le faire a l’échelle du monde, faut que je connaisse toutes les formulations qui peuvent évoquer que la vidéo est sponsorisée et ce dans toutes les langues. Cest une approche intéressante mais je préfère laisser ça aux ia pour l’instant !
@@BenjaminCode Ouais clairement si cette partie coûte une boule, j'utiliserais l'IA pour faire un set de données assez représentatif puis j'utiliserais d'autres techniques genre machine learning en le faisant repasser sur toutes les vidéos déjà labellisées un peu en mode régression linéaire pour le coup, ça devrait coûter 1000 fois moins cher le jour où tu passes à l'international
Putain benjamin j’suis désolez mes j’suis un script kiddie j’ai qu’un BTS et la tu utilise littéralement sélénium, mes je sais faire si tu veut le scrap sans détection j’ai refait EPIOS juste pour le kiffff 😂❤
Tu savais déjà que j’avais ce problème avant de cliquer ? Le point de la vidéo c’était pas de donner juste la réponse a ce problème mais de montrer tous les problèmes que j’ai rencontré et comment je les contournais chaque fois
@@BenjaminCode Mon avis n'étais pas complet, j'ai vraiment apprécié la vidéo ! Mais du coup on aurait voulu savoir comment t'as contourné ce gros problème, car c'est justement intéréssant
Salut, je viens de regarder ta précédente vidéo et je me disais que peut-être MeetSponsors figurerait au classement lol Où ça en est en terme de MRR ? Négatif ? J'ai l'impression que tu n'as pas fait beaucoup la promotion de ton projet. Tu parlais de LinkedIn, il y a aujourd'hui beaucoup de bullshit et de vendeurs de rêves mais quand même énormément d'opportunités et de build-in-public, ça mériterait quand même d'y faire un peu ta promotion je pense. 💪 De la force pour la suite
@@BenjaminCode je m'en suis rendu compte après mais j'étais trop pressé de savoir lol Pas de chiffres concernant le nombre d'abonnés ? 🫣 En tout cas c'est toujours un plaisir et c'est inspirant pour qqn en reconversion comme moi