Тёмный

Polars, una nueva era en el procesamiento de datos con Python. ¿Será mejor que Pandas?. 

datasciencecamp
Подписаться 1,3 тыс.
Просмотров 3,1 тыс.
50% 1

En este video te contamos de una nueva alternativa en el procesamiento de datos mediante #dataframes en Python.
Se trata de Polars, una librería potente y eficaz para manipular datos de gran tamaño de forma rápida. Mediante un ejemplo práctico te explicamos las alternativas que ofrece esta opción.
Link del ejemplo práctico en github: github.com/luise-marquezb/polars
#dataanalytics #datascience #csv #pythontutorial #coding #codingskills #dataframes #pandas #polars

Опубликовано:

 

12 дек 2023

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 8   
@multitaskprueba1
@multitaskprueba1 Месяц назад
Eres genial! Excelente video! Gracias! Puedes hacer un video q muestre un ejemplo de como manejar datos que son mAs grandes que la memoria ram en Polars y PySpark?
@datasciencecampbyedu
@datasciencecampbyedu Месяц назад
Si puedo agendarlo para unas próximas semanas
@carlosfelipegonzalezfrasse2834
@carlosfelipegonzalezfrasse2834 6 месяцев назад
Muy Buen contenido bro! Por favor sigue asi!! Nuevo Sub
@datasciencecampbyedu
@datasciencecampbyedu 6 месяцев назад
Un abrazo bro. Así será. Se viene bastante contenido que ya estamos preparando.
@GeeKBio
@GeeKBio 3 месяца назад
muy similar la sintaxis de librerías como pandas y/o pyspark
@datasciencecampbyedu
@datasciencecampbyedu 3 месяца назад
Así es amigo
@hadesishykaru
@hadesishykaru 6 месяцев назад
Pandas tiene un problema, porque cuando solo necesitas leer el nombre de las columnas, pandas carga todo el dataframe y luego te muestra el nombre de las columnas, pero cuando son muchas bases muy pesadas empieza a ser un problema, ¿como funciona acá?
@datasciencecampbyedu
@datasciencecampbyedu 6 месяцев назад
Hola. Un cordial saludo. La diferencia es que polars aprovecha mejor los recursos y de manera más óptima. Por ejemplo: Polars utiliza completamente la potencia del equipo dividiendo la carga de trabajo entre los núcleos de CPU, disponibles sin ninguna configuración adicional , tiene también control del uso de la memoria lo que hace que al cargar los datos o fuentes de datos, divida en procesos con mayor tiempo de respuesta. Es decir, no hay sobrecarga en tiempo de ejecución.