robot de la enciclopedia para niños

AlphaGo para niños

Enciclopedia para niños
Archivo:Alphago logo Reversed

AlphaGo es un programa informático de inteligencia artificial desarrollado por Google DeepMind para jugar al juego de mesa Go. En octubre de 2015 se convirtió en la primera máquina de Go en ganar a un jugador profesional de Go sin emplear piedras de handicap en un tablero de 19x19.

Se enfrentó contra el jugador chino Fan Hui 2p en una serie de 5 partidas oficiales, las cuales AlphaGo ganó, seguidas por unas partidas informales que acabaron 3-2 a favor de la inteligencia artificial. En marzo de 2016 se enfrentó a uno de los mejores jugadores, Lee Sedol 9p. El 9 de marzo de 2016, AlphaGo ganó la primera partida de este enfrentamiento. Hasta marzo del 2016, AlphaGo está clasificado número dos del mundo en el ranking no oficial de Rémi Coulom, con un elo de 3611 hasta julio del 2016. En reconocimiento por vencer a Lee Sedol, AlphaGo fue galardonado con un honorario 9-dan por la Asociación Coreana de Baduk.

AlphaZero supera a AlphaGo Zero y otros programas superiores de ajedrez y Shōgi después de solo 24 horas de juego. Después de 4 horas de juegos adquirió un nivel superhumano.

Hardware

AlphaGo se puso a prueba en hardware con varios números de CPU s y GPU s, que se ejecuta en modo asíncrono o distribuido. Dos segundos de tiempo de pensar se da a cada movimiento. El Elo resultante se enumera a continuación

Configuración y rendimiento
Configuración Hilos de
búsqueda
No. de CPU No. de GPU Ranking de Elo
Asíncrono 40 48 1 2,151
Asíncrono 40 48 2 2,738
Asíncrono 40 48 4 2,850
Asíncrono 40 48 8 2,890
Distribuido 12 428 64 2,937
Distribuido 24 764 112 3,079
Distribuido 40 1,202 176 3,140
Distribuido 64 1,920 280 3,168
Configuración y fuerza
Versiones Hardwares Elo Partidos
AlphaGo Fan 176 GPUs, distribuido 3.144 5:0 contra Fan Hui
AlphaGo Lee 48 TPUs, distribuido 3.739 4:1 contra Lee Sedol
AlphaGo Master Una sola máquina con 4 TPU v2 4.858 60:0 contra jugadores profesionales;

Cumbre del Futuro de Go

AlphaGo Zero Una sola máquina con 4 TPUs v2 5.185 100:0 contra AlphaGo Lee

89:11 contra AlphaGo Master

AlphaGo Zero

El equipo de AlphaGo publicó un artículo en la revista Nature el 19 de octubre de 2017, presentando AlphaGo Zero, una versión sin datos humanos y más sólida que cualquier otra versión humana anterior que derrotara al campeón. Al jugar juegos contra sí mismo, AlphaGo Zero superó la fuerza de AlphaGo Lee en tres días al ganar 100 juegos a 0, alcanzó el nivel de AlphaGo Master en 21 días y superó todas las versiones anteriores en 40 días.

Algoritmo

El algoritmo de AlphaGo utiliza una combinación de técnicas de aprendizaje automático y árbol de búsqueda, combinadas con una amplia formación, tanto desde el juego humano y como del ordenador. Utiliza árbol de búsqueda Monte Carlo, guiada por una «red de valor» y una «red de políticas», ambas implementadas mediante la tecnología de redes neuronales de aprendizaje profundo. Una cantidad limitada de detección de características pre-procesamiento-juego específico se utiliza para generar las entradas a las redes neuronales.

Las redes neuronales del sistema fueron inicialmente bootstrapeadas a partir de la experiencia de juego humano. AlphaGo fue entrenado inicialmente para imitar el juego humano, tratando de igualar los movimientos de los jugadores expertos de juegos históricos registrados, utilizando una base de datos de alrededor de 30 millones de movimientos. Una vez que había alcanzado un cierto grado de habilidad, era entrenado aún más al ser llamado a desempeñar un gran número de partidos contra otras instancias de sí mismo, usando aprendizaje por refuerzo para mejorar su juego.

Estilo de juego

AlphaGo ha sido descrito por el jugador de 9-dan Myungwan Kim como jugar «contra un ser humano» en sus partidos contra Fan Hui El árbitro del partido Toby Manning ha descrito el estilo del programa como «conservador».

Respuestas

AlphaGo ha sido aclamado como un hito en la investigación de la inteligencia artificial, como Go previamente ha sido considerado como un problema difícil en el aprendizaje de máquinas que se esperaba que este fuera del alcance de la tecnología de la época. Toby Manning, el árbitro de AlphaGo contra Fan Hui y Hajin Lee, y el secretario general de la Federación Internacional de Go han dicho que en el futuro, los jugadores de Go contarán con la ayuda de las computadoras para aprender lo que han hecho mal en los juegos y mejorar sus habilidades.

Sistemas similares

Facebook también ha estado trabajando en su propio sistema de juego de Go, el darkforest, el cual también se basa en la combinación de máquina de aprendizaje y búsqueda de árbol. Aunque es un jugador fuerte contra otro programas de computadora de Go, hasta principios de 2016, todavía no había vencido a un jugador humano profesional. darkforest ha perdido contra CrazyStone y Zen y se estima que es de una similar resistencia a CrazyStone y Zen.

Ejemplo de juegos

AlphaGo (negro) v. Fan Hui, el Juego 4 (8 de octubre de 2015), AlphaGo ganó por abandono.

Go ul.svg Go u.svg Go u.svg Go u.svg Go u.svg Go 79.svg Go 80.svg Go 68.svg Go u.svg Go u.svg Go u.svg Go u.svg Go u.svg Go u.svg Go u.svg Go u.svg Go u.svg Go u.svg Go ur.svg
Go l.svg Go 55.svg Go .svg Go 59.svg Go .svg Go 69.svg Go 66.svg Go 67.svg Go 48.svg Go .svg Go 83.svg Go 82.svg Go 85.svg Go 89.svg Go 97.svg Go 95.svg Go .svg Go .svg Go r.svg
Go 57.svg Go 54.svg Go 53.svg Go .svg Go 21.svg Go 18.svg Go 70.svg Go 65.svg Go .svg Go 64.svg Go 84.svg Go 81.svg Go 87.svg Go 10.svg Go 91.svg Go w4.svg Go .svg Go .svg Go r.svg
Go l.svg Go 58.svg Go 56.svg Go b3.svg Go 63.svg Go 22.svg Go .svg Go .svg Go 23.svg Go -.svg Go .svg Go 86.svg Go 88.svg Go 93.svg Go 92.svg Go 98.svg Go w8.svg Go .svg Go r.svg
Go l.svg Go 52.svg Go .svg Go 60.svg Go 61.svg Go .svg Go .svg Go 24.svg Go 25.svg Go .svg Go 90.svg Go .svg Go .svg Go 94.svg Go .svg Go b5.svg Go w6.svg Go .svg Go r.svg
Go l.svg Go .svg Go 62.svg Go 19.svg Go .svg Go .svg Go 28.svg Go 27.svg Go 29.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go b7.svg Go .svg Go r.svg
Go l.svg Go .svg Go 50.svg Go .svg Go 33.svg Go 39.svg Go 30.svg Go 26.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go b9.svg Go .svg Go .svg Go r.svg
Go l.svg Go 74.svg Go .svg Go 32.svg Go 36.svg Go 37.svg Go .svg Go .svg Go 34.svg Go 31.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go r.svg
Go l.svg Go 72.svg Go 73.svg Go .svg Go .svg Go 38.svg Go 41.svg Go 47.svg Go .svg Go 35.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go 49.svg Go 15.svg Go 40.svg Go 46.svg Go 42.svg Go 43.svg Go .svg Go -.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go x.svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go 51.svg Go 44.svg Go .svg Go .svg Go 45.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 13.svg Go 77.svg Go 11.svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go 71.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 76.svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 12.svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go 17.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 75.svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go b1.svg Go .svg Go .svg Go .svg Go .svg Go 20.svg Go -.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go w2.svg Go 78.svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go .svg Go .svg Go 16.svg Go .svg Go .svg Go .svg Go .svg Go 99.svg Go .svg Go .svg Go .svg Go 14.svg Go .svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go r.svg
Go dl.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go dr.svg
Primeras 99 movidas (96 a 10)
Go ul.svg Go u.svg Go u.svg Go u.svg Go u.svg Go b.svg Go w.svg Go w.svg Go u.svg Go u.svg Go u.svg Go 23.svg Go u.svg Go u.svg Go u.svg Go u.svg Go 20.svg Go u.svg Go ur.svg
Go l.svg Go b .svg Go .svg Go b .svg Go .svg Go b .svg Go w .svg Go b .svg Go w .svg Go .svg Go b .svg Go w .svg Go b .svg Go b .svg Go b .svg Go b .svg Go 18.svg Go 19.svg Go 26.svg
Go b.svg Go w .svg Go b .svg Go .svg Go b .svg Go w .svg Go w .svg Go b .svg Go .svg Go w .svg Go w .svg Go b .svg Go b .svg Go w .svg Go b .svg Go w .svg Go 22.svg Go 21.svg Go r.svg
Go l.svg Go w .svg Go w .svg Go b.svg Go b .svg Go w .svg Go .svg Go .svg Go b .svg Go x.svg Go .svg Go w .svg Go w .svg Go .svg Go w .svg Go w.svg Go w .svg Go .svg Go r.svg
Go l.svg Go w .svg Go .svg Go w .svg Go b .svg Go .svg Go .svg Go w .svg Go b .svg Go .svg Go w .svg Go .svg Go .svg Go w .svg Go .svg Go b .svg Go w .svg Go .svg Go r.svg
Go l.svg Go .svg Go w .svg Go b .svg Go .svg Go .svg Go w .svg Go b .svg Go b .svg Go .svg Go .svg Go .svg Go 30.svg Go .svg Go 28.svg Go .svg Go b .svg Go 25.svg Go r.svg
Go l.svg Go .svg Go w .svg Go .svg Go b .svg Go b .svg Go w .svg Go w .svg Go 17.svg Go .svg Go .svg Go 32.svg Go 27.svg Go .svg Go 29.svg Go b .svg Go .svg Go .svg Go r.svg
Go l.svg Go w .svg Go .svg Go w .svg Go w .svg Go b .svg Go .svg Go .svg Go w .svg Go b .svg Go .svg Go .svg Go 33.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go r.svg
Go l.svg Go w .svg Go b .svg Go .svg Go .svg Go w .svg Go b .svg Go b .svg Go .svg Go b .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go b .svg Go b.svg Go w .svg Go w .svg Go w .svg Go b .svg Go .svg Go x.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go x.svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go b .svg Go w .svg Go .svg Go .svg Go b .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go b .svg Go b .svg Go b .svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go b .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 40.svg Go .svg Go .svg Go .svg Go w .svg Go 65.svg Go 64.svg Go r.svg
Go l.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 39.svg Go 38.svg Go .svg Go 31.svg Go 41.svg Go .svg Go w .svg Go 63.svg Go r.svg
Go l.svg Go .svg Go .svg Go b .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 37.svg Go 36.svg Go .svg Go 46.svg Go 24.svg Go 42.svg Go .svg Go .svg Go r.svg
Go l.svg Go .svg Go .svg Go .svg Go .svg Go .svg Go 13.svg Go b9.svg Go .svg Go .svg Go 35.svg Go 34.svg Go .svg Go .svg Go 56.svg Go 55.svg Go b .svg Go 57.svg Go r.svg
Go l.svg Go .svg Go .svg Go b.svg Go .svg Go w6.svg Go .svg Go .svg Go w .svg Go x.svg Go b1.svg Go .svg Go 43.svg Go 45.svg Go 53.svg Go w.svg Go w .svg Go 15.svg Go r.svg
Go l.svg Go .svg Go 14.svg Go .svg Go .svg Go w .svg Go b5.svg Go b3.svg Go .svg Go 00.svg Go b .svg Go .svg Go 44.svg Go 47.svg Go w .svg Go 54.svg Go .svg Go 16.svg Go 58.svg
Go l.svg Go .svg Go .svg Go 02.svg Go 08.svg Go b7.svg Go 10.svg Go 11.svg Go w4.svg Go .svg Go 48.svg Go .svg Go 49.svg Go .svg Go 51.svg Go 52.svg Go 59.svg Go 61.svg Go 62.svg
Go dl.svg Go d.svg Go d.svg Go d.svg Go d.svg Go 12.svg Go d.svg Go 50.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go d.svg Go 60.svg Go d.svg Go d.svg Go dr.svg
Movidas 100-165.

Enfrentamiento

El encuentro
Partida no. Fecha Negras Blancas Resultado Movimientos
1 9 de marzo de 2016 Lee Sedol AlphaGo B+abandono 186
2 10 de marzo de 2016 AlphaGo Lee Sedol N+abandono 211
3 12 de marzo de 2016 Lee Sedol AlphaGo B+abandono 176
4 13 de marzo de 2016 AlphaGo Lee Sedol B+abandono 180
5 15 de marzo de 2016 Lee Sedol AlphaGo B+abandono 280
Resultado:
AlphaGo 4 – 1 Lee Sedol

Véase también

Kids robot.svg En inglés: AlphaGo Facts for Kids

kids search engine
AlphaGo para Niños. Enciclopedia Kiddle.