Тёмный

Cómo trabajar datos faltantes en un data set en Python 

Escuela De Bayes
Подписаться 6 тыс.
Просмотров 6 тыс.
50% 1

El día de hoy les traigo un video donde les explico cómo trabajar datos faltantes en un data set en Python.
Suscríbete al canal y aprende sobre ciencia de datos: bit.ly/suscrib...
Facebook Escuela de Bayes: bit.ly/escuelad...
Instagram Escuela de Bayes: bit.ly/escuelad...
Dataset: www.kaggle.com...
GitHub: github.com/lui...

Опубликовано:

 

21 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 19   
@carlosalbertosalazarmedina6288
@carlosalbertosalazarmedina6288 3 года назад
Gracias por compartir informacion tan valiosa, saludos desde Caracas
@erwinpablopenacasas7160
@erwinpablopenacasas7160 2 года назад
Muy buena explicacion sobre el tema...
@MrSergioruizcobo
@MrSergioruizcobo Год назад
Gracias capo!!!
@danieldiaz9203
@danieldiaz9203 3 года назад
Muchas Gracias, quisiera pedirte si podrias en elgun momento hacer uno de como rellenar los datos faltantes con regresion lineal o alguno otro metodo, o si y alo tienes te agradesco me lo compartas
@escueladebayes
@escueladebayes 3 года назад
Hola Daniel. Honestamente no he rellenado datos con regresión lineal, pero en los próximos días estaré lanzando un nuevo curso sobre Ingeniería de Variables o Feature Enginnering. Y los métodos de imputación que usaremos para variables continuas serán los siguientes: "Tratamiento de Casos Completos", "Imputación por la media o la mediana", "Imputación con valor arbitrario" e "Imputación al borde de la distribución". Espero haberte ayudado. Saludos.
@willi228
@willi228 3 года назад
hola. mira que el archivo del Excel esta dañado por alguna razón, no puedo cargarlo :/ saludos, que buenos videos, te agradezco por subir este contenido
@escueladebayes
@escueladebayes 3 года назад
Hola William. Muchas gracias por tu comentario! Te agradezco bastante. Te comento que hice nuevamente el proceso de descargar el archivo de la plataforma de Kaggle y cargarlo a Python y me funcionó con el siguiente código. import numpy as np import pandas as pd titanic = pd.read_excel(io = "/Users/lalemus/titanic3.xls") El problema posiblemente es que cuando grabé el video, el archivo estaba como .csv. Sin embargo, hoy cuando descargué el archivo nuevamente de la plataforma de Kaggle, el tipo del mismo es .xls. Esto implica que hay que cambiar un poco el código con respecto al momento de la grabación del video. Espero que esta información te haya servido. Saludos y comparte nuestro contenido para llegar a más personas!
@willi228
@willi228 3 года назад
@@escueladebayes muchisimas gracias
@gonzalomourelli4563
@gonzalomourelli4563 3 года назад
@@escueladebayes Hola, a mi me sigue saliendo error
@CafeColombia-cf6er
@CafeColombia-cf6er Год назад
A mi igual me sigue saliendo error @@escueladebayes
@em.b.5610
@em.b.5610 3 года назад
el metodo .ravel() que funcion cumple? porque yo estaba usando el metodo por ejemplo para contar pd.isnull(titanic["age"]).values.sum()
@escueladebayes
@escueladebayes 3 года назад
Hola! Tienes toda la razón. Puedes excluir la función .ravel() y te da el mismo resultado. Esta función se utiliza para convertir una Serie en un Ndarray. En este caso es indiferente. Muchas gracias por tu observación! Saludos!
@em.b.5610
@em.b.5610 3 года назад
@@escueladebayes Gracias por la respuesta y por todo el playlist de Pandas, lo estoy estudiando y me ha ayudo muchísimo a aprender a usar la libreria que es tan importante en la carrera! Muchas gracias por todo y muy buen playlist. Una recomendación que quizás pueda servir, vi que existe muy poco material practico en youtube para la visualización y representación de datos que esten en idioma español (en ingles también pero hay pocos recursos), enfocados en las aplicación de librerías más usadas de Matplotlib y Seaborn, si forman curso para estas librerias y sus aplicaciobes, sin dudas la veria toda. Muchas gracias
@escueladebayes
@escueladebayes 3 года назад
Tienes toda la razón! Las librerías de matplotlib y seaborn son una buena opción para diseñar un nuevo curso. Tomaré en cuenta esa recomendación y empezaremos a generar ese contenido. Saludos!
@elmelgarejor3041
@elmelgarejor3041 2 года назад
en mi caso no me fuciona con el ravel()
@mikewhoward1466
@mikewhoward1466 3 года назад
saludos buen contenido , quisiera saber porque cuando pongo col = titanic["age"].fillna(titanic["age"].mean()) me manda error TypError : can only concatenate str (not "int") to str
@escueladebayes
@escueladebayes 3 года назад
Hola Mikew. Muchas gracias por ver el video. Espero que hayas podido solucionar el error que te sale al rellenar datos faltantes. Si aún no lo has hecho te sugiero revisar los tipos de datos que tienes en la columna de "age". Asegúrate de que todos los valores en esa columna sean "str". De igual forma te sugiero poner este error en google para encontrar otras posibles soluciones. Saludos.
@MaximilianoRodriguezGuitlein
Como hago si las columnas no tienen nombre?
@f.gabrielsosarozzi2661
@f.gabrielsosarozzi2661 2 года назад
De donde descargo el archivo csv?
Далее
Pandas en 30 minutos (Python)
35:22
Просмотров 246 тыс.
Tutorial: LIMPIEZA DE DATOS con Python y Pandas
33:48
¿Cómo manejar los DATOS FALTANTES?: guía completa
11:10
Imputación (o Manejo de Datos Faltantes) con Python
23:33
Python y PySpark: ¡Aprende a hacer ETL como un PRO!
48:55
El Gráfico de Cajas (y cómo hacerlo en Python)
13:12
Просмотров 1,3 тыс.
Tutorial: ANÁLISIS EXPLORATORIO DE DATOS con Python
53:57