El GM Pepe Cuenca analiza una de las mejores partidas de Alpha Zero, la creación de Google que ha derrotado a Stockfish, el mejor módulo de análisis del mundo
Pepe, en total jugaron 100 partidas. 28 de ellas fueron victorias de alpha zero y el resto tablas. Es interesante que de las 28 victorias de alphazero, 25 de ellas fueron con blancas. Otra cosa importantísima es que alphazero aprendió absolutamente desde cero, ya que solamente le dieron las reglas del juego y un sistema de autoaprendizaje genérico, evitando cualquier otra influencia humana, como si fuera un extraterrestre inteligentísimo al que le dices las reglas, entrena solito durante 4 horas, y ya supera con mucho todo lo hecho por los humanos en toda la historia del ajedrez, incluidos nuestros mejores módulos. También es muy interesante que en tan solo 4 horas ya pareció descartar por completo (por ser malas) aperturas que nosotros venimos jugando durante siglos, como la defensa francesa. Es sencillamente BRUUUTAAAL.
Es muy natural que la mayoria de las victorias sean con blancas, si te fijas, los jugadores de la élite raramente pierden con blancas, puesto que llevan un tiempo de ventaja. Pepe Cuenca ha mencionado este aspecto en alguno de sus videos.
a stockfish solo se le permitia un gb de su potencia, y un minuto por jugada, stockfish con toda su potencia ya veremos q pasa. por otro lado parece que alphazero a llegado al limite de su curva de aprendizaje, x lo que si stockfish con mas potencia le gana significara que alphazero por mucho q entrene no le ganara. es interesante el nuevo tipo de modulos de autoaprendizaje, pero ya se vera asta donde es verdad lo q nos dicen de alphazero.
Si crecimiento es Logaritmico, quiere decir que cada vez es mas difícil que aprenda cosas nuevas, pero que a su vez NUNCA dejara de aprender, por lo que su potencial en la curva de aprendizaje es ilimitado.
Pepe, vi las partidas en otros canales, pero realmente estaba esperando el tuyo porque sos el mejor. Me encanta!!. 21min se pasan volando. Segui asi !!!!
solo una cosa, el modulo stockfish 8 no jugo con su mejor version, y tuvo algunas limitaciones tecnicas, y aunque 28-0 suena a paliza y es una paliza, hubo 72 tablas, o sea que en el 72% de las partidas alphazero no las pudo ganar. Creo que es un poco pronto para pensar que alpha zero puede llegar a la perfeccion en ajedrez, pero es solo una opinion, por cierto, el articulo publicado por los creadores de alphazero es muy interesante. Como siempre, Gran Maestro, haces el ajedrez divertido y a la vez muy interesante y eso es muy de agradecer, un saludo y sigue asi.
Un algoritmo claramente es, pero no es un algoritmo para jugar ajedrez, es un algoritmo para aprender a hacer cualquier cosa, en este caso le explicaron las reglas del ajedrez y lo hicieron jugar con sigo mismo durante 4 horas, para darse cuenta como jugar ajedrez y ser el mejor. ahí descubrió muchas de las estrategias actuales por casualidad y muchas otras nunca empleadas por humanos. Nunca se baso en el juego humano para aprender.
a mi me gustaría saber en esas 4 horas, cuantas partidas/variantes/jugadas calculó el aparatito.. Ahora en 2021 debe ser mucho más terrible... buen video Pepe!
Excelente video don pepe, pero por favor a todo el equipo ches24, este video era de hace 3 días. Aunque soy fiel a su gran estilo de comunicar y enseñar el ajedrez. Seguiré apoyando y disfrutando de sus videos desde México.
Hola Pepón! Te escribo varios años después de publicado este video, no sé si lo leerás. Recuerdo cuando salió Alpha Zero, que en 4 horas de autoentrenamiento superó contundentemente a Stockfish, lo más avanzado hasta la época en cuanto al nivel de las máquinas, y recuerdo de estar tan asombrado y maravillado como te veo en los primeros minutos del video. Hoy en día, 6 años después, la inteligencia artificial avanzó a lo loco, y ya hace un tiempo tenemos, por ejemplo, a Chatgpt, en donde uno escribe en un prompt lo que se le cante, y en segundos te elabora una respuesta increíble. Sin ir más lejos, yo lo uso para programar, y me resuelve en instantes cosas muy específicas que me ahorran mucho tiempo. Me quedé pensando en la pregunta que te hacés justo antes de empezar con la partida: ¿cuál es el límite? Hoy, 6 años después, la pregunta está más vigente que nunca, llegando a un punto que hasta ya da miedo. ¿Cuál es el límite de la inteligencia artificial? Hoy ya es legítimo dudar de casi todo, uno puede ver un video de un famoso diciendo cualquier cosa, o a Freddie Mercury cantando Toxicity de SOAD con un realismo que asusta. ¿Cuál es el límite? Muy interesante y peligrosa época nos toca vivir. Abrazo Pepón, y gracias por tanto que nos regalás con el ajedrez.
Muchos canales ya analizaron las 10 partidas, nada nuevo. Pero nadie habla de la características en las que corrió Stockfish, al parecer no eran las adecuadas o al menos las que se utilizan en los campeonatos de máquinas. Yo hasta que no vea al equipo de Google inscribir su Alpha Zero a uno de estos campeonatos y ganarlo creeré que realmente tenemos una nueva generación de motores de análisis de ajedrez.
El simple hecho de que la jugada Ag5! no pueda ser encontrada por el mejor módulo del mercado puesto a trabajar al máximo durante 6 horas te habla un poco de lo que es AlphaZero ...un monstruo.Además AlphaGo (su homónimo del Go) fue puesto a trabajar de la misma manera y destrozó al campeón del mundo de Go, siendo que este juego es mucho más complejo que el ajedrez.Así que sí ... la inteligencia artificial del AlphaZero está a un nivel completamente diferente.
las condiciones para SF fueron injustas, entre otras cosas, se le limito a 1 G la memoria. Yo espero un match justo, sin trampa alguna porque solo eso le dara sentido a una victoria. Aun asi tambien hay q reconocer el avance que significa alphazero si es q es asi
Cierto. Ademas a cada uno de los modulos se le dio 1 minuto por jugada. Esto no es injusto, pero, como sabemos que alphazero no fue optimixado para jugar rapido? Es decir, stochfish administra sus tiempos por jugada, le toma mucho mas jugar aperturas que finales, tal vez si se les diera un tiempo fijo para toda la partida stockfish usaria mejor su tiempo para pensar mas durante la apertura (los finales ya vimos que los resiste muy bien, aguantar 50 jugadas con desventaja material no me parece una derrota tan aplastante)
Oye cabezón: los amantes del ajedrez amamos tu cabezón y los amantes del cachondeo también. Como miembro de ambos grupos te felicito por tu capacidad para unirlos con gran naturalidad. Serio y estricto en el comentario de las variantes o connotaciones de cada jugada y suficientemente cachondo para poner el acento y la broma en algunos puntos de inflexión de la partida. También el ritmo de tus vídeos es el más adecuado 3:04. "Si. Se podría decir" Resumiendo: "Ratatatatatatatatatatatatá......" Cambio de tema: En algunos registros lingüísticos el termino "almendra" se refiere a la cabeza. También se llama "almendrado", de apellido, a un helado de nombre Magnum. No sé a cuál haces referencia pero yo tomo ambas como válidas y me parto.
Ya esperaba con ansias este vídeo! Por cierto, un detalle: Stockfish no usó toda su capacidad (1gb de memoria) ni su libro de aperturas, entonces jugó con un poco de desventaja.
Gabriel Alvarez por que es su primer paso... stockfish ya ha llegado a su tope... alphazero es nuevo... su estilo de aprendizaje es novedoso... es el pez saliendo del agua...
habría que saber cuanto han subido las acciones de Google desde el fenomeno Alpha Zero,.. aún así es bonito, a ver si va a resultar que todos los sacrificios de Tal eran correctos
No es un programa de ajedrez. Es una inteligencia artificial que sirve para muchos propósitos, solo lo colocaron a jugar ajedrez para hacer una demostración.
¿Sabes que es una inteligencia artificial y un programa de ajedrez? Tanto el modúlo de Stockfish como Alpha Zero son programas de ajedrez e inteligencias artificiales, dado a la definición de inteligencia artificial, un sistema que toma decisiones que los hombres las consideran inteligentes. Ambos son programas de ajedrez porque utilizan algoritmos de búsqueda, se diferencian en que Stockfish utiliza un modelo lineal utilizando parámetros del tablero para valorar las posiciones mientras que Alpha Zero emplea una red neuronal con distintas capas, la capa de entrada del sistema neuronal es el estado del tablero y las neuronas de las distintas capas están conectadas entre sí. Alpha Zero aprende cuando simula partidas contra sí misma y le da un valor a esas conexiones pudiendo evaluar las posiciones del tablero. Realmente es muy interesante como funcionan este nuevo programa pero demasiado complejo, te recomiendo que leas el artículo que publicaron los programadores de Alpha Zero e investigues más acerca de los programas de ajedrez, sin duda todos inteligencias artificiales.
PEPE gran vide un saludo y espero te hayan gustado los tacos lamento no poder ir a tus conerencias un punto importante, creo que alphazero es casi como un antes del enroque o antes de que el peon avanzara doble ahora la teoria se va a modificar cres que ya en torneos de elite se usen jugadas de este dios del ajedre alphazero
Me exploto la cabeza cuando paraba el vídeo para hacer el calculo y adivinar la mejor mi cerebro. Entro en error y me sacaron pal loquero me tuvieron que hacer un reinicio de sistema que forma de calcular esas computadoras ni en mil vidas adivinaría alfil G5
Es verdad la polémica que se ha generado sobre AlphaZero? Hasta el mismo Nakamura lo ha dicho. Es bestial la diferencia que hay entre el poder de los procesadores de Alpha y Stockfish... Como que a Stockfish lo corrés desde tu laptop y AlphaZero (Además que es totalmente privado) tiene toda la potencia de las máquinas de GOOGLE. Encuentro algo de sentido en esto.
10:53 el módulo pone como continuación Df5 con -0.71 de valoración sin embargo Stockfish hace h6 con igualdad, a pesar de que la continuación de Df5 seguía dando medio punto de ventaja a las negras
Hay una cosa que hay que tener en cuenta. En más de un vídeo en RU-vid he visto que se resalta que AlphaZero "sólo entrenó 4 horas", que si hubiera entrenado un día entero quien sabe lo que sucedería y tal. Hay que tener en cuenta que 4 horas para un ordenador es mucho tiempo, seguramente en esas cuatro horas jugó miles (o incluso millones) de partidas. Esas 4 horas pueden equivaler a lo mejor a más una vida de estudio de un humano. Y además de todo eso, si hubiera entrenado todo un día seguramente los resultados no serían mucho mejores, ya que estoy casi seguro que la curva de aprendizaje debe ser logarítmica, es decir, llegados a un punto ya no podrá aprender apenas por mucho tiempo que pase. Me gustaría que alguien más metido en el mundo de la IA compartiera su opinión conmigo y con el resto de gente, ya que yo soy un estudiante de informática pero mis estudios están orientados a la ingeniería del software y se muy poco de IA y computación.
Y también se me olvidó comentar, AlphaZero no usa el machine learning de la misma manera como lo han usado otros motores de ajedrez (Stockfish creo que lo usa también), se apoya en redes neuronales. Quizá ahí pueda estar la clave. Aún así, habría que ver como se desenvuelve Stockfish en unas condiciones más favorables, esta vez ha conseguido hacer tablas en casi 3/4 de las partidas, tampoco creo que se trate de una revolución del ajedrez como nos lo están vendiendo.
en 6:48 no es una novedad, es lógica la jugada de stockfish ya que si a d5 de negras ( que sería un error y que dices que "todos" jugarían) se viene Af6 ganando blancas la calidad
A que velocidad se jugaran estas partidas? Digo, los algoritmos se mueven a una super velocidad en el procesador y supongo que acada movimiento no se detienen a "pensar" demaciado los software al momento de enfrentarse.
olvidate!!! pense la misma jugada!!! pero se ve claro!! obviamente se ve, pienso que porque se advierte de antemano que existe una buena jugada!!! en una partida posiblemente no se veria con naturalidad, aunque considero que al estar viendo videos de este tipo, los conceptos de desviacion siempre fueron mi interes principal!!! al punto que aun ante mi precaria vision del analisis de ajedrez, llegue a pensar que los modulos encontraran en breve, infinidad de variables en base a este concepto!! y desde los comienzos de las partidas!!! sacrificando y desviando con una precision extrema!!! y rompiendo esquemas posicionales petreos, ortodoxos de los cuales hemos estado alienados desde hace mucho tiempo!!! quizas veamos desde las aperturas y defensas, sacrificios de piezas mayores con el fin de desviar y quedar finamente mejor posicionados en un par de jugadas posteriores, todo gracias a la reestructuracion de conceptos y lineas de ataque sugeridos y demostrados por la nueva era de la inteligencia artificial!!!
Quiero ver a Stockfish con las piezas Blancas y alphazero con negras, me parece sumamente sospechoso que solo hayan publicado 10 partidas y todas con Blancas de alphazero, Stockfish tiene 3400 Ello , no sé esto me parece muy raro
A mí lo que me deja loco es que juegue sin libro de aperturas, encontrar mejores jugadas que los humanos en la partida viva es lógico pero superar siglos de análisis en 4 horas de entrenamiento es de locos.
PEPE, en verdad, yo considero que tu, tambien puedes ver estas jugadas, y no necesariamente por ser un GM, sino que ademas me atreveria a decir, que un jugador de 1800 o quiza 2000 elos bien puestos, en este tipo de posiciones, definiria asi, la partida!!! y me parece que claramente, se debe al logro posicional al que llego alpha zero a esta altura de la partida!!! esta todo calculado, no hay nada colgado o sin defender, esta quirurgicamente planteados todos los conceptos de tiempos, posibles sacrificios para lograr bloqueos, los cuales hacen perder tiempos valiosos a los recursos disponibles de las negras!!!! todas sus piezas, no solo estan lejos, sino que inactivas!!! y por ultimo, ya apenas entrados en el minuto 17, esta copado el entusiasmo que le pones a la posibilidad de CF6!!!!! PORQUE SI TU CON TU NIVEL, ADOPTAS ESTOS HERMOSOS CONCEPTOS DE DE SACRIFICIO PARA BLOQUEAR, Y GENERAR PERDIDAS DE TIEMPO A LAS PIEZAS MAYORES DEL ENEMIGO, DESVIAR Y ATACAR, COMENZARAS A PENSAR EN LO QUE YO CONSIDERO LA NUEVA ERA Y REESCRITURACION DE CONCEPTOS!!!! EN BASE A ESTE CONCEPTO E IDEAS QUE SE ME OCURRIO, RECUERDO QUE UNA VEZ, EN UNA PARTIDA, ME DISPUSE A PERSEGUIR A LA DAMA DE MI ADVERSARIO POR GRAN NUMERO DE JUGADAS, INTENTANDO QUE ME COMIERA MI PROPIA DAMA!!! LO CURIOSO DE TODO ESTO, ES QUE LE GENERO UN GRAN DESEQUILIBRIO POSICIONAL!!! TODO ESTO SE BASO EN QUE SI YO LOGRABA DESVIAR SU DAMA DE POR EJ: LAS CASILLAS BLANCAS, LOGRABA QUE NO PUDIERA REGRESAR A LA DEFENSA DE SU REY EN 1 TIEMPO!!! PERO ESA PERSECUSION, ME HIZO ADVERTIR OTRAS COSAS, POR EJ: QUE SI AUN YO NO LOGRABA EL OBJETIVO PERSEGUIDO, PASABA POR LUGARES CLAVES DE ATAQUE A OTRAS PIEZAS, OFRESIENDOME LA POSIBILIDAD DE GANAR MATERIAL!!! POSICIONES QUE NO HUBIERA PODIDO LOGRAR DE OTRA MANERA!!! RESUMIENDO: EN ESE SIN NUMERO DE JUGADAS CON EL AFAN DE NO COMERME LA DAMA, PARA EVITAR LA DESVIACION, TERMINABA HACIENDO UBICAR MEJOR Y GANAR MATERIAL, PRODUCTO DE FACILITARME LA OPORTUNIDAD DE QUEDAR CON MI DAMA, JUSTO AL LADO DE PIEZAS IMPORTANTES DE MI OPONENTE!!! Y TODO POR EVITAR EL CAMBIO!!!