Hola a todos, llevo trabajando 3 años como DS en una empresa más o menos grande de Latinoamérica y algo que me gustaría destacar es que pongan mucha atención a la parte matemática ( álgebra lineal, estadística, optimización) que se menciona en el video. Nos ha tocado entrevistar muchos "DS" que solo se enfocan en aprender a "programar modelos" ( seguir la receta y hacer .fit y .predict) y muchas veces no entienden lo que hay por detrás, así que cuando les hacemos pequeñas variaciones a lo usual o cuando les pedimos que nos expliquen cómo funciona el modelo que nos proponen, no saben muy bien como responder. Entiendo que es algo no muy glamoroso ( y que toma tiempo) por que está todo ya programado , pero si quieren seguir éste camino les puedo decir que se nota la diferencia entre alguien que entiende a cabalidad como funciona lo que está haciendo y alguien que no.
@@eliezercortorreal7257 nop, de hecho dije todo lo contrario. De la gente que entrevistamos muchos solo se enfocan en la parte de programación y no tienen idea de la parte matemática/estadística que funciona por detrás de los modelos , así que cuando se enfrentan a problemas que no son estándar no saben cómo abordarlos ( Y ojo que cada vez hay más empresas que ofrecen herramientas de Auto Machine learning para éste tipo de problemas) Si me preguntas a mí ( o al menos sobre lo que me toca trabajar ) las habilidades serían la siguientes: 1) Aprender a modelar problemas ( necesitas entender el negocio/ problema y conectar eso con lo que sabes) 2) Estadística, álgebra lineal y optimización. 3) Programación, en particular saber manipular datos y programación de alto rendimiento ( lenguajes serían SQL y python/r como base) 4) Tener un "instinto" para poder entender lo que te están mostrando los datos y adelantarte a posibles sesgos a los que te puedas estar enfrentando( creo que ésto no se puede estudiar y es algo que se desarrolla trabajando solamente)
Gracias a este comentario, pude entender porque los matemáticos pueden ser SD, muchos usan la fórmula pero pocos se preguntan de dónde sale esa fórmula
Mientras te escuchaba hablar de estadística me acordé que cuando estudiaba en la universidad yo amaba las pruebas de hipótesis, y toda la estadística inferencial, me sentía una rara, un bicho de otro pozo... ahora me estoy reencontrado con ese mundo fascinante. Gracias por todos tus consejos! Un capo! Abrazo a la distancia desde Argentina
Increible!! Yo tambien amaba hacer pruebas de hipotesis, trabajar con distribuciones normales, poisson!! Encontrar la distribucion estadistica de una lista de datos con Chi-Cuadrado. Tambien sentia que estaba solo en ese "amor" Saludos!
Sii, lo bonito es tener ese sentimiento dejavoo, el reencontrarte con esas materias de universidad y por fin ver que se aplican en conjunto para una Ciencia más completa y compleja.
Luego de grabar el video he notado un problema con el audio. Espero que no te impida aprovechar este video porque creo que tiene muchas claves importantes de las cosas que todo data scientist debería saber. Puedes hacer click en el tiempo de la sección del video que quieres ver para saltar a ella: 👇👇 🚀 Ya abrió la inscripción para el curso de portafolio, hasta el viernes 9 de junio de 2023. Puedes inscribirte aquí 👇👇 escuela.gonzalezgouveia.com/courses/portafolio-data-science 00:00 Intro 01:33 Consejos 02:17 Básico - Programación 03:16 Básico - Estadística 04:56 Básico - DataViz 06:13 Like 06:29 Medio - EDA 07:58 Medio - Machine Learning 11:51 Medio - Base de Datos 13:54 Avanzado - Scraping 14:55 Avanzado - TS, PCA, NLP, DL, CV 16:54 Avanzado - Big Data y Cloud 18:54 Conclusión Si has viso esta lista hasta el final comenta un 🦄
Buenas noches, actualmente estoy por terminar el 7mo semestre de Ingeniería y la verdad es que soy bueno "resolviendo" problemas de cualquier tipo, aprendí c++, java, python, desarrollo web y R, además de unos frameworks, sin embargo, no me nace como tal programar más de 4 o 5 horas lo habitual (diseño web o aplicaciones de escritorio), por otro lado cuando lleve estos cursos de estadística y algebra lineal en la universidad me encantaron y fui de los pocos que sobrepasaron un ponderado de 15, más adelante con python y R ese gusto por manejar datos y gráficos en un curso llamado algoritmos gráficos fue algo natural y por ello aprendí R por mi cuenta, hace unos días vi una publicación donde mencionaban tus habilidades y los campos a los que podrías dedicarte, decía CIENCIA DE DATOS (SI TE GUSTAN LAS MATEMATICAS), pienso que sería un gran cambio dejar de lado mis bases de otros lenguajes para centrarme netamente en aprender más sobre ciencia de datos, voy a darle duro hasta fin de año y vuelvo para decir como me fue, y si el cambio resulto ser lo mejor en mi carrera, muchas gracias.
Eres el tío más simpático del mundo! Es el primer vídeo que veo tuyo. Ya me he suscrito y me voy a hacer maratón del resto de tus vídeos relacionados con este tema! Muchísimas gracias por tu ayuda para introducirme a este mundillo!
saltar de diseño grafico, aprender lo que se refiere todo sobre base de datos y lo que engloba es un salto enorme, pero a esforzarse, gracias por compartir tus consejos
Rafa, yo siento que las bases mas importantes para ser data scientist deberia incluir matematica, especialmente la matematica de matrices (linear algebra), por que la usamos en todos lados con las factorizaciones de matrices, si uno entiende como gemometricamnte funcionan los algoritmnos de PCA, NMF, SVM, etc, podriamos no solo saber usar los algorithmos pero tambien como modificarlos, la parte que tu mencionas de derivadas en calculo, falto incluir que no es derivadas en una funcion sino tambien en matrices, como la matrix de hassel etc, que la usamos para ver por que los metodos numericos en las matrices convergen (aun que sea local minimuns). en resumen: - MAtematica avanzada de Algebra linear / Optimizacion / Math modeling / Real Analysis (especialmente Measure theory/Lebesgue) que la necesesitamos para entender theoria de probabilidad de Kolmogorov. - Statistics (todo lo que mencionaste de statistical methods, Theory of Probability), Machine learning (statistical Learning). - Computer Science: aqui entran varias areas, que puedes especializarse: - Base de Datos (queries), Programacion (R/Python) y lenguages para adultos como (C++, C#, Java, etc), Big Data (Spark/Hadoop), ETL. - NLP, Sentiment Analysis, Text Mining, Deep Learning, Computer Vision, etc. - el negocio en el que quuieras trabajar, por ejemplo yo me enfoco en la industria del software, otras personas pueden tener otro tipo de industria que tenga clientes con diferentes comportamientos etc. la idea es entender cuales son las preguntas de negocio y como responderla de manera que presentas recomendaciones de negocio (no numeros sueltos). - el ultimo y no menos importante: ser Story teller, saber llegar a tu publico (que usualmente son personas de negocio, no matematicos, no estadisticos, no computer scientist) normalmente tenemos que saber explicar las razones y dar las recomendaciones sin entrar en detalles de numeros, y mas bien hacer ver el mensaje sencillo en visualizaciones intuitivas. y esto del data visualizacion es un mundo aparte por si solo, pero tambien es necesario saberlo. pero en general, es saber comunicar, presentar tus numeros como lo hacia carl sagan en cosmos! ser super articulado verbalmente implica mucha practica, adelantarse a las posibles preguntas y tener las respuestas a la mano, conocer a tu auditorio etc. yo creo que esta parte de ser un comunicador es en la que mas dificultad nos encontramos nosotros los que venimos del mundo abstracto de la matematica, y es a la que usualmente deberiamos dedicarle mas tiempo.
Saludos desde Santo Domingo, República Dominicana. Me encantó tu vídeo. Hasta ahora ha sido la guía para convertirse en científico de datos más detallada y específica que he visto. Solo me viene un pensamiento a la cabeza: está describiendo un pensum.
Muchas gracias muy buen video!!! realmente logras llegar a una profundidad incrible, dando acceso a esta profundidad a personas principiantes como yo que no sabemos mucho en lo que nos estamos metiendo
2 года назад
Me agrada como lo has desglosado, ahora tengo una mejor idea para empezar esta nueva carrera de Data Science. Gracias.
Geniaaaal, pero para estadística agregaría Estadística multivariante, para entender mejor que es lo que está detrás del Machine Learning. Además de Estadística No paramétrica
Muchas gracias por la ruta, realmente me dejo en claro de debo estudiar primero para pasar a la Industria Tech y por el momento como le puedo utilizar en mi trabajo actual
Excelente contenido. Me extraña que no recomendaras R jeje Yo aprendí primero Python y cuando inicie en R se me hizo sencillo. R tiene lo suyo. En Python actualmente estoy estudiando las librerias pandas, numpy y matplotlib. Tambien estoy estudiando calculo y estadística. Aspiro a mitad del próximo año empezar a buscar trabajo. Este mundo es fascinante. Agradezco tu contenido, ya que fue de los primeros que mire antes de lanzarme a este campo. ¡Gracias!
Gracias Danilo, fue una decisión dificil no mencionarlo y tienes toda la razón en que R tiene lo suyo. Quise hacer esta ruta lo más consisa posible para los que buscan trabajar como científicos de datos, por eso mencioné lo específico a Python nada más. Espero que te vaya muy bien con tu búsqueda de trabajo :D saludos!
Excelente, en mis tiempos esto se denominaba como DSS soporte a la toma de decisiones en las empresas, solo que ahora tenenos nuevas tecnologías. Pero hay otra herramienta en auge y se viene pisa do duro a futuro. Muchas gracias!
¡Mamá! Salí en un video de Rafa :D muchas gracias por el video de la ruta para data scientist. Soy estudiante de último semestre de matemáticas y esta información me ayuda para saber realmente qué hay que estudiar, muchas gracias bro. Saludos desde Colombia.
Excelente explicación te felicito amigo, hay tantas cosas que se ven en ingenieria y posgrado que me reventaba la cabeza, pero mas que nada se nota tu visualización para tener claridad en los conceptos como la ruta de aprendizaje. Exito y buena información, te ganaste un suscriptor!!!
Excelente vídeo, me interesa mucho lo de data scientist ya que estoy trabajando en un anteproyecto para el aprendizaje de la matemáticas en la universidad
Yo soy un experto en estadística y matemáticas, pero la programación no la tengo fuerte, ahorita la estoy puliendo porque al entender la estadística veo enorme el potencial de se Data Scientist…
Estoy basicamente en el camino de la ruta intermedia, pensé que estaba más atrasado y efectivamente, la parte de estadística y matemática toma su tiempo, pero me siento impresionado, me he subestimado mucho :O
Eso no es un data science😡😡😡, eso es un data analyst. Para ser data science te faltó: demostraciones matemáticas, matemáticas discretas, álgebra lineal, estadística multivariada, análisis lineal, métodos bayesianos, db no estructurada, y un campo de aplicación como física, finanzas, economía, biología, ingenieria, Medicina, etc.
Hola, Rafa, el próximo año entraré a la universidad y la ciencia de datos es una de mis opciones. Me gusta cómo se maneja la profesión, mi mayor fuerte son las matemáticas, pero apenas soy un principiante en Python. He visto que un científico de datos tiene cuatro características principales: estadística, programación, comunicación y la parte de negocios. Mi pregunta es: ¿estas cuatro características vienen en la misma proporción o hay más de estadística o programación en ello?
Es una buena pregunta Rui. Haciendo una estimación rápida y sin compromiso diría que puede ser algo como: 15% estadística 25% programación 35% comunicación 25% parte de negocios Por supuesto, estos números varían de trabajo en trabajo y creo que en trabajos junior es más importante la parte de estadística y programación y a medida que avanzas se hace más importante la parte de comunicación con clientes y entender su negocio. Espero te ayude :)
Hola Rafa. Me pareció muy útil tu video. Veo que en él te centras en Python a la hora de nombrar ejemplos y me gustaría preguntarte si, como es mi caso, el lenguaje de programación que domino es R se puede seguir esta misma ruta que propones. ¿Si es posible, me podrías recomendar cursos que se centren en los niveles medio y avanzado que mencionas? Yo he pasado un par sobre machine learning de la plataforma Alison y me han parecido muy buenos. Un saludo y felicidades por tu canal. Eres un excelente comunicador
Hola Alejandro, muchas gracias! Es posible, también hay científicos de datos que utilizan R como lenguaje principal. En este video me he centrado en Python porque suele ser lo más pedido. Pero dependerá de cada caso y persona. De cursos tengo que revisar mejor los de niveles medios y avanzados. Espero poder crear contenido al respecto.
Hola Rafa! muchas gracias por el video, muy bueno !!. Una duda con respecto al último punto... es mejor enfocarte en algo como deep learning, nlp, etc o enfocarse en un rubro (energía, retail, medicina, etc)
hola Octavio, es una buena pregunta. cada cosa tiene sus pro y sus contras. enfocarte en una tecnología como nlp o deep learning puede abrirte la puerta de cargos con mejor paga porque hay menos gente que los hace. sin embargo, como la tecnología cambia mucho es posible que en el futuro se usen otras tecnologías y te toque reaprender o cambiar. En cualquier caso, creo que la decisión también dependerá de lo que creas que te guste mas a ti. Es un poco lo que he hecho yo
Muchas gracias Rafa, he estado pensando en estudiar una carrera de ciencia de datos y tu video me ayudó mucho a saber mas acerca de que es lo que voy a ver en esta :)
gracias por este video!!, una pregunta llevo como 8 años trabajando con MATLAB e incluso he programado metodos de MachineLearning desde cero en esta plataforma, y tengo una formación como ingeniero, Master y Doctorado. Mi pregunta es donde puedo encontrar o sabes tu de diplomados para ser data science???
Hola, dejo mi LIKE, min 13:45 usted menciona que dejemos nuestros comentarios, y bueno yo estoy siguiendo sus tutoriales, muchas gracias por su tiempo que nos dedica, mi pregunta seria que yo quiero enfocarme en la Robótica, y sobre iot, he pensado en lo que menciona de utilizar la Librería Matplotlib y bueno, convertir las imágenes en datos, en matrices, entonces, como me plantearía yo para seguir este camino que me gusta, visión artificial, y sobre todo, estoy a full aprendiendo BD, aprovechando que SQL es universal, y que una instrucción en Xampp o Wampp o microsoft sqlserver es lo mismo que en Oracle, y ojala nunca cambie eso, (Incluso NoSql utiliza Sql en su planteamiento =) ), pero estoy empezando, y bueno me interesa por sobre todo lo que es base de datos, uniéndola a arduino y eso, robótica, espero poder conversar con usted, y seguir aprendiendo, muchas gracias a sus respuestas
Me encantó su ruta! Ya la voy a escribir y ponerlo en una lámina grande en mí habitación para recordar siempre la ruta de datos. Una consulta, power bi se puede aprovechar en esa ruta?
Muchas gracias Rafa, tengo una pregunta, que recomiendas primero, seguir esta ruta, o empezar con los 5 libros que recomendaste en el video posterior a este. Gracias!
Me encanta esta espec de DS pero también el desarrollo de software. Ahora quisiera saber una especificación mínima y recomendada en cuanto a la PC o computadora a usar, algo como requisitos de sistema para usar programas de DS y SD. Saludos desde Perú, buen contenido!
estoy buscando un curso de SQL para generar reportes y análisis de bases de datos en ventas. Necesito un curso completo, que empiece desde 0 y continúe hasta un nivel intermedio/avanzado. Me ayudas con una recomendación por favor
Se desarrolló frontend y una reclutadora me dijo que aprendiera además Python antes de recomendarme, mi pregunta, aprendo data science o backend? Que tiene mejor sueldo?
@@19laplace Muchisimas gracias por tu respuesta, ok voy a investigar un poco la verdad es que no distingo bien las diferencias, pero a buscar una buena ruta a seguir
Gracias por la ruta, mira tengo ya varios conocimientos de los que mencionas pero quisiera hacer algunos proyectos, sabes de algunos proyectos guiados en todos los niveles (principiantes, intermedios y avanzados) para ir desarrollando y que nos permitan poner en práctica todos los conocimientos. Te agradecería enormemente si nos intuyes o haces un video con proyectos para cada nivel.
Jajaja, los mecatrónicos creen que pueden con todos, pero he notado que son los más pendejos, son los peores en programación, mecánica y electrónica. Y ahora resulta que quieres ir a data science no inventes.
Mecatrónica está alejado de data science, tienes que iniciar casi de 0. Estudia una carrera de data science o ya de perdida una de estadística. No recomiendo el posgrado de data science a un ingeniero, porque las matemáticas de ciencias son diferentes a las ingeniería.
Hola Rafel, gracias por esas guías tan importantes. Una pregunta que tengo hace un buen tiempo es un DS tiene que hacer todo o puede manejar un pedacito del proceso, manejo de datos, manejo de base de datos, estadísticas, visualización, gracias por su rta.
Hola Rafa me gustan muchos tus videos, una pregunta en donde me recomiendas cursos, para aprender python, estadística desde lo básico, para poder adentrarme en Data science, ya tus videos me motivan a seguir ha esta ruta.
Hola Hugo. Por un lado puedo recomendarte la escuela en donde tengo un curso de python y pronto va a salir la segunda edición del curso de portafolio de datos ( escuela.gonzalezgouveia.com/collections ) otros lugares donde puedes buscar cursos seria en udemy, platzi, datacamp o quizas si alguien mas que conozca otro curso que le haya servido lo puede dejar por aqui seria bueno :)
Hola Rafael, saludos, te agradezco por tu contenido me ha ayudado a entrar en la ciencia de datos. Tengo una pregunta, solía ser usuario de Stata y quiero saber si hay alguna función en R o Python que se asemeje a rangestat del primer programa mencionado, gracias de antemano
@@RafaGonzalezGouveia gracias Rafael por tu atención, estoy trabajando la encuesta nacional de uso del tiempo de Colombia; sus tres variables llave son directorio, secuencia y orden, que significan vivienda, hogar y persona respectivamente. Ahora bien, si una persona dentro de cada hogar cuida a una persona dependiente existe una variable que guarda el número de orden de esa persona, supongamos que el jefe de hogar cuida a su hijo de 2 años, entonces en la variable aparece el número de orden de ese niño, yo quiero crear una variable que ponga al lado la edad de la persona dependiente que el cuidador atiende.
Hola! Siento que tengo lo necesario para este rubro... pero soy malo trabajando bajo presión, en sus experiencias se trabaja bajo presion? o se tiene buen tiempo para trbajar?
Genial video! Una duda, si se tiene formación de pregrado en desarrollo de software y estadística, ¿Consideras necesario un título como maestría? gracias!