Тёмный

Polars : Le MEILLEUR outil Python pour créer tes Data Pipelines ? 

Data From Scratch - Willis
Подписаться 14 тыс.
Просмотров 1,7 тыс.
50% 1

Опубликовано:

 

9 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 17   
@nonovenful
@nonovenful 15 дней назад
Polars peut remplacer Pandas et Spark. Dans mon équipe on l'utilise pour des volumétries de données au format parquet allant jusqu'à 30 Gb et je pense que l'on peut encore augmenter la quantité de données traitée. Un de ses grands avantages est le similarité de syntaxe avec Spark qui facilite l'adoption.
@potaryx4281
@potaryx4281 3 месяца назад
Merci
@serge_amon
@serge_amon 3 месяца назад
Salut. Un bootcamp, la durée ? C'est quoi la différence entre le lead dev et tech lead ?
@DataFromScratchWillis
@DataFromScratchWillis 3 месяца назад
Salut à toi Serge, Le bootcamp sera de 10 semaines. Ensuite, pour la différence entre lead dev et tech lead, c'est pareil
@sonaltsat
@sonaltsat 3 месяца назад
Penses-tu que Polars est interessant également sur des petits datasets ou Pandas reste plus interessant dans ce cas ? (A part pour tester Polars bien entendu)
@DataFromScratchWillis
@DataFromScratchWillis 3 месяца назад
Je t'ai rep sur linkedin
@smartlearn2.0
@smartlearn2.0 3 месяца назад
Que pensez-vous de dask? Il utilise aussi l'exécution en parallèle
@DataFromScratchWillis
@DataFromScratchWillis 3 месяца назад
Je n'ai pas encore testé Dask, mais va falloir que je me penche dessus également
@user-ie1su7vg3z
@user-ie1su7vg3z 3 месяца назад
Bonsoir ! Merci pour le Bootcamp. Cela coûte combien ?
@DataFromScratchWillis
@DataFromScratchWillis 3 месяца назад
Je vais annoncer tout ça par email. Check tes mails si tu t'es inscrit à la waiting list :)
@BigQueyrie
@BigQueyrie 3 месяца назад
HS : serait-ce un petit cardigan lichen d'une marque française ? 👀
@DataFromScratchWillis
@DataFromScratchWillis 3 месяца назад
Oui oui ... c'est bien celui-là 👀
@Hayssams
@Hayssams 3 месяца назад
Spark fonctionne très bien en mono machine et multi-coeur(local[*]) est disponible sur vscode / notebook et offre un SQL complet. Ja JVM est une bête de course. Je n’ai pas compris l’argument polars à part la hype
@DataFromScratchWillis
@DataFromScratchWillis 3 месяца назад
J'adore Spark, et effectivement, Spark fonctionne en local/monomachine, mais ça embarque une bonne complexité qu'il ne faut pas négliger (les systèmes distribués sont complexes par nature, même si tu le local en mono). Polars permet de t'abstraire de cette complexité (comme le fait Pandas) tout en te donner une bonne puissance de calcul.
@helenlundeberg
@helenlundeberg 3 месяца назад
Overkill pour du medium sized data. Il y a des benchmarks qui permettent de s'en convaincre.
@helenlundeberg
@helenlundeberg 3 месяца назад
Je parle de spark of course
@Dbeau177
@Dbeau177 3 месяца назад
Un coeur ? C’est quoi ?
Далее
Data Engineer JUNIOR : Tout ce que tu devrais savoir
10:45
6 concepts Python que tu dois maîtriser
6:39
Просмотров 4,2 тыс.
ДОМИК ДЛЯ БЕРЕМЕННОЙ БЕЛКИ#cat
00:45
Comment dépasser ta peur de Git ?
9:12
Просмотров 1,5 тыс.
DuckDB : Pourquoi cet outil va changer ton quotidien ?
7:27
Architecture Data 3/3 : le Lakehouse
6:07
Просмотров 2 тыс.
DATA ANALYST, DÉCOUVRE UN MÉTIER
3:35
Просмотров 10 тыс.
Why I chose Python & Polars for Data Analysis
24:33
Просмотров 6 тыс.
La fin des Data Scientists ?
6:04
Просмотров 11 тыс.