Тёмный

PySpark tuto 1 : Ingestion, Manipulation et Analyse d'un grand volume de données | Big Data 

J.A DATATECH CONSULTING
Подписаться 12 тыс.
Просмотров 2,3 тыс.
50% 1

Dans le paysage actuel de l'analyse de données en entreprise, la manipulation et l'analyse de gros volumes de données #bigdata sont devenus monnaie courante. C'est là que #pyspark entre en jeu. PySpark est un outil puissant qui offre une solution efficace pour travailler avec des ensembles de données massifs, et c'est pourquoi il est devenu indispensable pour tout professionnel des données.
Que vous soyez un #datascientist, un #dataanalyst, un #dataengineer ou un développeur, maîtriser PySpark ouvre un monde de possibilités dans le domaine de l'analyse de données. En effet, être capable de manipuler et d'analyser de gros volumes de données en utilisant PySpark vous donne un avantage concurrentiel indéniable sur le marché du travail.
Dans cette vidéo, nous plongerons dans les bases de PySpark, en explorant ses fonctionnalités essentielles pour la manipulation et l'analyse des données. Que vous soyez débutant ou que vous cherchiez à approfondir vos connaissances, cette vidéo vous fournira les bases nécessaires pour démarrer avec PySpark et vous préparer à manipuler efficacement de gros volumes de données en entreprise.
Le contenu de cette vidéo provient de mon livre 𝐏𝐲𝐒𝐩𝐚𝐫𝐤 𝐞𝐧 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞: 𝐂𝐚𝐬 𝐝'𝐮𝐬𝐚𝐠𝐞𝐬 𝐫𝐞́𝐞𝐥𝐬 𝐞𝐭 𝐞𝐱𝐞𝐦𝐩𝐥𝐞𝐬 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞𝐬 𝐞𝐧 𝐃𝐚𝐭𝐚 𝐒𝐜𝐢𝐞𝐧𝐜𝐞 𝐞𝐭 𝐌𝐚𝐜𝐡𝐢𝐧𝐞 𝐋𝐞𝐚𝐫𝐧𝐢𝐧𝐠 dont vous pouvez acheter la version papier via ce lien : www.amazon.fr/... ou la version PDF via ce lien : afoudajosue.gu...
Voici la vidéo de présentation de PySpark et du contenu du livre : • PySpark en pratique : ...
Source des données : data.cityofchi...
Lien pour télécharger directement les données : data.cityofchi...
Lien du Notebook : github.com/Jos...
𝑽𝒐𝒖𝒔 𝒂𝒗𝒆𝒛 𝒕𝒐𝒖𝒔 𝒍𝒆𝒔 𝒅𝒆́𝒕𝒂𝒊𝒍𝒔, 𝒄𝒐𝒎𝒎𝒆𝒏𝒕𝒂𝒊𝒓𝒆𝒔 𝒂𝒊𝒏𝒔𝒊 𝒒𝒖𝒆 𝒍𝒆𝒔 𝒆𝒙𝒑𝒍𝒊𝒄𝒂𝒕𝒊𝒐𝒏𝒔 𝒅𝒖 𝒄𝒐𝒅𝒆 𝒅𝒂𝒏𝒔 𝒍𝒆 𝒍𝒊𝒗𝒓𝒆.
Merci de vous abonner à ma chaîne RU-vid / @realprodatascience et à ma page #linkedin : / josu%c3%a9-afouda

Опубликовано:

 

8 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 8   
@fabricekra1418
@fabricekra1418 4 месяца назад
Merci à vous monsieur
@kidam901
@kidam901 Месяц назад
Est ce que le jeu de donnée peux provenir des bases de données de l'app web pour etre traiter ensuite ?
@billessomba1212
@billessomba1212 5 месяцев назад
Merci beaucoup. Pourrais tu faire d'autres vidéos sur Pyspark et si possible un tutoriel Kafka?
@user-zr2ir9yz4w
@user-zr2ir9yz4w 5 месяцев назад
Bonjour! Vraiment une très belle vidéo comment pouvons nous implémenter nos modèles du deep learning sous pyspark? ça va m'aider. je me dis aussi qu'on peut utiliser GPU sous colab pour aller plus vite
@abdoulayediole460
@abdoulayediole460 5 месяцев назад
Bonsoir M Afouda, merci pour tout l’effort. Au fait un ami qui réside en France m’a acheté le livre pyspark la version kindle, mais j’arrive pas à y accéder depuis le maroc. Est-ce qu’il ya un autre moyen, pour que je puis en profiter? Merci
@RealProDatascience
@RealProDatascience 5 месяцев назад
Allez regarder dans la description de la vidéo. Vous trouverez le lien d'achat de la version PDF
@RealProDatascience
@RealProDatascience 5 месяцев назад
Le contenu de cette vidéo provient de mon livre 𝐏𝐲𝐒𝐩𝐚𝐫𝐤 𝐞𝐧 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞: 𝐂𝐚𝐬 𝐝'𝐮𝐬𝐚𝐠𝐞𝐬 𝐫𝐞́𝐞𝐥𝐬 𝐞𝐭 𝐞𝐱𝐞𝐦𝐩𝐥𝐞𝐬 𝐩𝐫𝐚𝐭𝐢𝐪𝐮𝐞𝐬 𝐞𝐧 𝐃𝐚𝐭𝐚 𝐒𝐜𝐢𝐞𝐧𝐜𝐞 𝐞𝐭 𝐌𝐚𝐜𝐡𝐢𝐧𝐞 𝐋𝐞𝐚𝐫𝐧𝐢𝐧𝐠 dont vous pouvez acheter la version papier via ce lien : www.amazon.fr/dp/B0C9K6GTNH?ref_=ast_author_ofdp ou la version PDF via ce lien : afoudajosue.gumroad.com/l/yeatg
@dongmoazafack2130
@dongmoazafack2130 5 месяцев назад
Salut Josue j’espère que tu vas bien! Comment faire pour entrer en contact avec toi
Далее
Le vrai métier de Data Analyst (vision globale)
47:10
Architecture Data 1/3 : le Data Warehouse
4:51
Просмотров 2,4 тыс.
Why More People Dont Use Linux
18:51
Просмотров 182 тыс.
Multi-Tenant: Database Per Tenant or Shared?
8:55
Просмотров 11 тыс.