Pablo: En mi adolescencia (hace ya unos 40/45 años) escribía mucho, muchísimo y recuerdo que luego de escribir un cuento (cortito) me puse a contar las veces que aparecía cada letra y cada palabra (de hecho, debajo del cuento están las anotaciones de las cuentas que hice). Una de las reflexiones que no anoté pero si recuerdo fue ¿qué pasaría si tuviera limitado el uso de ciertas letras o palabras para escribir un texto? Tal vez no avancé en esos pensamientos porque ya con lo que había hecho me sentía bastante loco y fuera del contexto general... A esta altura y gracias a este video, vengo a descubrir que estaba menos loco de lo que pensaba y que hay gente mucho más allá de mi locura. Saludossssssss
Hay un escritor francés qué se llama Peret y escribía novelas y cuentos imponiéndose reglas como la que decís vos. La novela "El secuestro" está escrita sin usar ni una sola vez la letra más usada del francés (esa letra es la que está secuestrada). A la criticable sonó rara la novela pero no se dieron cuenta!!
@@augusto-uy3kk cuando tenía 18 era grunge, Nirvana, Pearl JAm, Stone Temple Pilots, etc. Parte de lo lindo de crecer y volverse viejo es poder dominar el bajón y la idea de que uno no encaja y se quiere morir. Así que vos tranquilo. Abrazo
La ley de Zipf en criptografía es muy usada, delatan muchas cosas la repetición de símbolos. Hasta puedes saber a que idioma pertenece el texto antes de descifrar por su patrón.
En el cuento "El Escarabajo de Oro", de Edgar Allan Poe (1843, siglazo!) el protagonista descifra el mensaje encriptado precisamente utilizando la frecuencia estadística de los símbolos, en congruencia con las letras más frecuentes del inglés. Cien años antes de Zipf.
Yo sí re entendí el de la Ley de Benford. Aunque llevo años estudiando mates y el concepto ya me era familiar. Pero en su momento pensé que tu vídeo era mucho más accesible y coloquial que otros de divulgación que había visto.
Si debo admitir que muchas veces me sorprendió con sus conocimientos. Tipo vos lo ves y no parece que sepa mucho de matemática, pero bueno, las apariencias engañan. Saludos.
Soy lingüista y en clases jamás de los jamases se mencionó a don Zipf. Sí nos dieron con Chomsky hasta que nos saliera por las orejas pero la verdad este es un flor de #DATAZO porque explica el porqué de lo que enseñamos en los niveles más básicos de español a no-nativos (o cualquier otro idioma).
Год назад
Excelente el video, me encanta. Los textos - o datos - tienen otra propiedad que se llama entropía que, en general, dicta que las palabras (o datos) que menos se repiten son las que entregan mayor sentido a todo el conjunto.
El principio de Pareto se usa mucho en gestión. En Ing. de Software por ejemplo, cuando se hace el análisis y estimación de los riesgos de un proyecto se suele estimar la linea de corte para que el plan de control de riesgos se guíe por el 80/20. Es decir, que el plan de eliminación de riesgos se focaliza en una gestión de los 20% riesgos más potenciales (que se llevarían el 80% del esfuerzo), y luego se deja en el plan de contingencias el 80% menos peligrosos (y que por regla, solo son el 20% del esfuerzo). Respeto a la ley de Zift, si bien la conozco, tengo que admitir que no recuerdo si hay alguna utilidad práctica fuera del análisis de textos para comprobar si un texto ilegible pudiera está cifrado (mal dicho encriptado). Tenemos en la Teoría de la Información un modelo probabilistico para medir cuanto bits se necesitan para registrar la información. Pero si hay alguna utilidad en criptografía, la verdad desconozco. No es mi área.
Me quedé esperando la escena post créditos de Moli diciendo "de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de".
Hola Pablo podririas hacer un TOP 30 veces que se hicieron errores cartograficos en peliculas (como el de Villa Gesel con nieve) creo que seria muy interesante. #DATAZO
Por si sirve para complementar o algo. Hay algo llamado "densidad léxica", que refiere a la densidad de información que se presenta en un texto, según cuántos elementos gramaticales (palabras funcionales) y léxicos (palabras de contenido) haya en él: un texto escrito es más denso, o sea tiene más palabras de contenido, mientras que el texto oral contiene más elementos gramaticales. Videazo, Pablo. Me hiciste pelar los apuntes pero valió la pena.
sos un grande vamos #datazo y perdon centenial. este ultimo muchos recuerdos. parece que viviamos en la misma cuadra o hasta hermanos porque a mi me pasaba y hacia las mismas cosas que vos. a parte del terrome terrome, tesin tesan.... lo haciamos distinto y tambien estaba.... una avion japones cuantas bombs tira al mes. y a quien le tocaba mes decia un numero por ejemplo 4 y contabas hasta 4 y ese salia del grupo..
En otros tiempos calculé la frecuencia de la letra inicial de las palabras del inglés y el español; ya que el diccionario bilingüe se notaba más sucio por los dedos las muescas de la letra. En inglés predominan la RST mientras que en español era ABC... El procedimiento fue fácil, hice la diferencia del número de página donde comienza la B menos el del inicio de la A, luego C menos B, etc... no conté las palabras, sino la cantidad de carillas que ocupa cada letra inicial...
Fantástica la explicación del surfshark, deberían ponerte para hacer la propaganda institucional. Me gusta cuando explicas lo de Pareto con cosas del día a día, estás hecho un catedrático, Pablo! Felicitaciones🥇
Incluso, más que del contexto dependen del sentido que se crea en un sintagma. Si nos fijamos, es sumamente lógico que muchas de las palabras que más se repiten sean preposiciones, conjunciones o determinantes, que son de base gramatical. En otras palabras, estas sirven para afianzar las estructuras, pero a diferencia de las léxicas (sustantivos, verbos, adjetivos) poseen significados incompletos si no se articulan con estas últimas. Me parece que llamarla 'ley' es un montón, dado que es un término usado para una medición matemáticamente exacta... Optaría más por el término 'principio'.
Jajaja. Es el último video de #datazo que me faltaba ver y cuando hiciste la pausa donde anunciabas el siglo, en ese silencio antes que tú, yo exclamé, "Siglazo, ¡siglazo!'. Jajaja 😂
Me voló la cabeza que todo lo hayas incluido en el análisis, porque para eso tuviste que tener completo el video incluida la parte en la que nos decís el resultado del análisis. Lo que termina siendo un caso como el del gato de Schrödinger. Entonces, ¿Acaso hiciste 2 videos uno en el que coincidía y otro que no y los analizaste los 2?
Pablo, conocía a la ley de Pareto (soy ingeniero, creo que todos lo conocemos...o lo sufrimos, jajaja) pero no conocía la ley de Zipf. Para hacer otro video, es un poco mas matemático, pero está el muy interesante Teorema de Pick. Saludos.
02:41 esto quedaría más pro si por cada vez que se diga siglazo se divide la pantalla en 2, cosa que al final haya un coro diciendo lo mismo, o tal vez no sea tan buena idea pero hay que probar XD
Te tengo una idea (nombrame si la usas 😂) el efecto meissner. Es un efecto que sucede sobre los superconductores cuando están bajo un punto de enfriamiento crítico que hace que se produzca la levitación.
Hola Pablo! Gracias por tantas horas de compañía y buena onda, pero después de un par de años disfrutando de tus videos de Datazos (geniales siempre) tengo una pequeña sugerencia: ¿Podías renovar la linea musical, buscarle un cambio, darle un respiro, no sé, seguramente sea yo y te pido disculpas por ser tan caradura, pero ya escucho el tan tan, tara rara tantan, tan, tararatan, tan , tan ...tanmpatanmpatapam, pam, tamparararanpam, pam... ( y sigue en loop hasta el infinito) que me impide disfrutar de tus interesantisimos datazos y sólo quiero que pare ya la musiquitaaaa!! (perdón, se me saltó la cadena) Insisto, gracias por tanto y sos lo más, a pesar de la musiquita de fondo. Nada, sólo eso. (Va con onda, espero no meter la pata) Abrazo!!
A la ley de Zypf la aprendí en el uso, cuando leía un libro nuevo sabía que si me aprendía el vocabulario del capítulo 1 seguramente ya me serviría para los siguientes, ya que los autores se suelen casar con varios términos y los reutilizan bastante.
Lo de Paretto lo había visto en la facultad. Pero al igual que en este video, no explicaron su fundamento matemático, sino su aplicación en la resolución de problemas. Ahora voy a googlear y leer más sobre el tema. Si si, mucho tiempo libre tengo, jejejeje.
Muy interesante. Te agrego dos cosas. La primera es que la canción más escuchada desde el siglo XX, es yesterday. La segunda es Michelle (a,base de Paul McCartney solo) y la segunda tiene más o menos la mitad que la que primera (no recuerdo los números), ahora me entero que cumple la Ley de Zipf. La segunda es que si te aprendes las palabras más frecuentes de un idioma… no te sirve para una mierda. Porque esas palabras modulan las que verdaderamente transmiten el contenido. Será eso también una ley?😊😊
Encontré un ajuste en Wolfram P(n)=1/(n ln(1,78N)), con N total de palabras diferentes. En base a eso hice un par de números y sí, se cumple aproximadamente Pareto: cerca de 80% para el primer 20% de las palabras. Para que funcione tiene que haber mínimo aproximadamente 10 veces más palabras que palabras distintas (si no, la ley daría que hay palabras que aparecen 0 veces, y como van a estar 1 vez, empiezan a pesar y alterar la curva). EDIT: corrí una simulación, a partir de las 700 palabras distintas ya se acerca al 80-20. Con 20000 palabras distintas (el Quijote anda por ahí) estamos en 85-15.
3:30 en fotografia, el "punto medio" de color se toma al 82% de blanco, o 18% de gris. por que? porque el valor en binario del 82% de 255 (blanco) es complementario con el valor del 18%, y tiene la misma cantidad de bits.
Este video será utilizado para dar clases de Mecánica Estadística, específicamente de Teoría de Información para entender el concepto de entropía. Gracias por ahorrarme explicaciones.
En principio es por otros motivos, pero la ley de Zipf me recuerda a que en esperanto, según estudió un esperantista, el 95% de lo que se dice habitualmente en conversaciones normales está formado por 500 raíces de palabras. O así era cuando hizo el estudio hace unas décadas. Con eso hizo un método de aprendizaje del esperanto basado en aprender, además de la gramática, esas 500 raíces, de manera que al final del curso básico se tiene un buen léxico.
Veo estos segmentos #datazos sabiendo de antemano que no los voy a entender pero me entretienen. Difiero con la segunda parte del slogan "información complementaria inútil pero que se va a quedar agarrada en tu cerebro". Si la información es completamente inútil, por qué debería quedarse agarrada en mi cerebro? No tiene ningún sentido. Admito abiertamente que no conozco (ni me interesa conocer) prácticamente ninguno de los conceptos que se fueron viendo y explicando en los diferentes videos de esta sección. Mientras no le falte el respeto a nadie, puedo opinar y escribir lo que sea acá. Muchas gracias. Buenas noches.
Me encantó!!! 😂😂😂😂 Sobretodo la parte nerda, suelo hacer lo mismo para ahorrar espacio en la hoja y mente y quienes están conmigo me miran como diciendo: "¿De verdad?" O "¿Qué 💩 dice?"😂😂😂😂
Otra ley interesante para los mortales es la ley de los grandes números. Y el “principio del palomar” que suena súper obvio pero del cual se desprenden razonamientos interesantes