Тёмный

Aprende a realizar pre-procesamiento de Datos en Python: Variables Dummy (One Hot Encoding) 

Escuela De Bayes
Подписаться 6 тыс.
Просмотров 7 тыс.
50% 1

Muchos algoritmos de Machine Learning no pueden funcionar directamente con variables categóricas.
En este video te muestro paso a paso a cómo realizar un método efectivo para convertirlos en un tipo de variable que el algoritmo pueda procesar. Este método se llama One Hot Encoding y te enseño a aplicarlo en Python en este video.
Suscríbete al canal y aprende sobre ciencia de datos: bit.ly/suscrib...
Facebook Escuela de Bayes: bit.ly/escuelad...
Instagram Escuela de Bayes: bit.ly/escuelad...
Dataset: www.kaggle.com...
GitHub: github.com/lui...

Опубликовано:

 

21 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 17   
@tatyanasilchenko4045
@tatyanasilchenko4045 4 месяца назад
gracias Luis, seguimos en el curso, contigo a fin del mundo y a por todas
@tatyanasilchenko4045
@tatyanasilchenko4045 3 месяца назад
wow mencanta q grande!!! muchas gracias Luis, me descubres el mundo! comentar para los alumnos: creando la funcion hay q respetar tabuladores, así funcionara, escribiendo def create..(.....): --> enter --> tab
@mariadelosangelesmunozbece4837
@mariadelosangelesmunozbece4837 3 года назад
Hola Luis, gracias por compartir tus conocimientos, ya he realizado el curso de análisis de datos con Python y este. Quisiera saber si continuarás subiendo videos en este curso, así estaré pendiente, en caso contrario, con qué videos puedo continuar?. Gracias, un abrazo desde Cali, Colombia
@escueladebayes
@escueladebayes 3 года назад
Hola Maria! Me alegra mucho que estés llevando los cursos. En las últimas semanas no hemos publicado contenido porque estamos preparando una sorpresa para todos, sin embargo, retomaremos el curso en los próximos días. De igual manera, me gustaría recomendarte que te apoyes en el libro "Python for Data Analysis" Segunda Edición de Wes Mckinney. Es muy bueno. En los próximos videos del curso nos enfocaremos mucho en Feature Engineering (Data Cleaning and Preparation). Saludos hasta Cali, Colombia.
@mauriciodanieltelleznava2463
Muchas gracias!!
@carlosgomezmartin9859
@carlosgomezmartin9859 6 месяцев назад
Hola Luis, a mí la función me divide la variable categórica en variables 'True' or 'False' en lugar de hacerlas cuantitativas con los valores 0 y 1, ¿podrías decirme cómo conseguir ese formato? Gracias y enhorabuena por el canal, muy didáctico.
@JesúsLópezLópez-u6q
@JesúsLópezLópez-u6q 5 месяцев назад
lograste decifrar como?
@jincolchadosaldivar5953
@jincolchadosaldivar5953 Месяц назад
a mi me sale igual true y false , a pesar que las columnas son de tipo object o string , la razón no lo se pero convirtiendo los true y false a *int* si nos bota los binarios de 1 y 0---> *astype(int)*
@christianespana1
@christianespana1 3 года назад
Hola, excelente explicación y contenidos. Una pregunta que otro método puedo usar a parte de one hot encodig cuando mi varíable toma tcientos o millones de valores posibles? . Pues si hago one hot encodig se me crearán cientos o millones de columnas nuevas y creo que no sería tan eficiente. Gracias de antemano por su respuesta.
@escueladebayes
@escueladebayes 3 года назад
Hola. Muchas gracias por tu pregunta. En mi experiencia no he visto una variable dentro de un conjunto de datos con cientos o millones de categorías. Lo que sí te puedo decir es que podemos utilizar el "Label Encoding" cuando tenemos variables ordinales. De esta manera etiquetarías a cada categoría con un valor numérico y no habría necesidad de crear nuevas columnas. De lo contrario, siempre se utilizaría el método de "One Hot Encoding". Espero haberte ayudado. Saludos y muchas gracias por consumir nuestro contenido!
@diegogonzalez9953
@diegogonzalez9953 3 года назад
Por si te sirviera de algo amigo, te adjunto un video en el cual explica como utilizar "Label Encoding" . ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-YvEx0IGKTko.html
@ciromuzzachiodi3986
@ciromuzzachiodi3986 3 года назад
Muy bueno el tutorial! te consulto, habra alguna forma de juntar las columnas? digamos por ejemplo que en sexo sea: Mujer=0 y Hombre=1. Saludos!
@fullnesmindcristiano8638
@fullnesmindcristiano8638 Год назад
Hola amigo ese metodo se utiliza para predecir datos o cual es el metodo que se utiliza para predecir datos
@ivancarhuapoma1184
@ivancarhuapoma1184 2 года назад
Hola, una consulta. Cuando aplico dummie, por ejemplo: dm_new=pd.get_dummies(new_df, columns=['Variable_category']) y luego lo imprimo, el Dataframe ya se encuentra con las columas dummie y no veo necesario concatenar. Saludos
@franciscomiranda3239
@franciscomiranda3239 3 года назад
Códigos fuentes??
@escueladebayes
@escueladebayes 3 года назад
Hola Francisco! Muchas gracias por escribirnos. En los próximos videos estaremos compartiendo los links para que accedan a los códigos fuentes. Saludos! 📊
@franciscomiranda3239
@franciscomiranda3239 3 года назад
@@escueladebayes estaré expectante
Далее
O’zim bilib ketvotudima😅
01:00
Просмотров 649 тыс.
GONE.Fludd, ЛСП - Ути-Пути (official video)
03:37
¿Cómo codificar datos categóricos?
13:16
Просмотров 1,4 тыс.
Top Courses to Become a Data Analyst
13:35
Просмотров 599 тыс.