robot de la enciclopedia para niños

AlphaGo para niños

Enciclopedia para niños
Archivo:Alphago logo Reversed
AlphaGo es un programa de inteligencia artificial que juega al Go.

AlphaGo es un programa de inteligencia artificial creado por Google DeepMind. Su propósito principal es jugar al Go, un antiguo juego de mesa de estrategia. En octubre de 2015, AlphaGo hizo historia al ser la primera máquina de Go en vencer a un jugador profesional sin ninguna ventaja inicial en un tablero grande de 19x19.

AlphaGo se enfrentó al jugador profesional chino Fan Hui en una serie de cinco partidas oficiales, ganándolas todas. Luego, en marzo de 2016, se midió con uno de los mejores jugadores del mundo, Lee Sedol. AlphaGo ganó la primera partida de este emocionante encuentro. En ese momento, AlphaGo estaba considerado como el segundo mejor jugador de Go del mundo en un ranking no oficial. Por su victoria contra Lee Sedol, AlphaGo recibió un honorario 9-dan, que es el rango más alto en el Go, otorgado por la Asociación Coreana de Baduk.

En 2017, otra versión llamada AlphaZero, también de DeepMind, superó a AlphaGo Zero y a otros programas de ajedrez y Shōgi (un juego de mesa japonés similar al ajedrez). AlphaZero logró un nivel de juego superior al humano después de solo 4 horas de entrenamiento.

¿Cómo funciona AlphaGo?

AlphaGo utiliza computadoras muy potentes para funcionar. Se probó en diferentes configuraciones, usando muchas CPU y GPU. Estas son como los "cerebros" de la computadora que le permiten pensar y calcular. AlphaGo tenía solo dos segundos para decidir cada movimiento en el juego.

Aquí puedes ver cómo las diferentes configuraciones de hardware afectaron su rendimiento, medido con un sistema de puntos llamado Elo:

Configuración y rendimiento
Configuración Hilos de
búsqueda
N.º de CPU N.º de GPU Ranking de Elo
Asíncrono 40 48 1 2,151
Asíncrono 40 48 2 2,738
Asíncrono 40 48 4 2,850
Asíncrono 40 48 8 2,890
Distribuido 12 428 64 2,937
Distribuido 24 764 112 3,079
Distribuido 40 1,202 176 3,140
Distribuido 64 1,920 280 3,168

También hubo diferentes versiones de AlphaGo, cada una más fuerte que la anterior:

Configuración y fuerza
Versiones Hardwares Elo Partidos
AlphaGo Fan 176 GPUs, distribuido 3.144 5:0 contra Fan Hui
AlphaGo Lee 48 TPUs, distribuido 3.739 4:1 contra Lee Sedol
AlphaGo Master Una sola máquina con 4 TPU v2 4.858 60:0 contra jugadores profesionales;

Cumbre del Futuro de Go

AlphaGo Zero Una sola máquina con 4 TPUs v2 5.185 100:0 contra AlphaGo Lee

89:11 contra AlphaGo Master

¿Qué es AlphaGo Zero?

El equipo de AlphaGo presentó una versión aún más avanzada llamada AlphaGo Zero en octubre de 2017. Lo especial de AlphaGo Zero es que no aprendió de partidas jugadas por humanos. En cambio, aprendió a jugar Go desde cero, jugando millones de partidas contra sí mismo.

Al jugar contra sí mismo, AlphaGo Zero se hizo increíblemente fuerte. En solo tres días, superó la fuerza de AlphaGo Lee (una versión anterior), ganándole 100 partidas a 0. En 21 días, alcanzó el nivel de AlphaGo Master, y en 40 días, superó a todas las versiones anteriores.

¿Cómo aprende AlphaGo?

El programa de AlphaGo usa una combinación de técnicas de aprendizaje automático y búsqueda en árboles. Esto significa que aprende de la experiencia y explora muchas posibilidades de movimientos en el juego.

Al principio, AlphaGo fue "entrenado" observando cómo jugaban los humanos. Se le mostraron alrededor de 30 millones de movimientos de partidas históricas de Go para que imitara a los jugadores expertos. Una vez que aprendió lo básico, siguió mejorando jugando muchísimas partidas contra sí mismo. Este método se llama aprendizaje por refuerzo, donde el programa aprende de sus propios errores y aciertos.

El estilo de juego de AlphaGo

Los expertos describen el estilo de juego de AlphaGo como muy interesante. Myungwan Kim, un jugador profesional de Go, dijo que jugar contra AlphaGo era como jugar "contra un ser humano". El árbitro de las partidas, Toby Manning, lo describió como un estilo "conservador", lo que significa que AlphaGo jugaba de forma segura y cuidadosa.

El impacto de AlphaGo

AlphaGo ha sido un gran avance en el campo de la inteligencia artificial. Antes de AlphaGo, se pensaba que el juego de Go era demasiado complejo para que una máquina lo dominara por completo.

Los expertos creen que en el futuro, los jugadores de Go podrán usar programas de computadora como AlphaGo para analizar sus propias partidas. Esto les ayudará a entender dónde se equivocaron y cómo pueden mejorar sus habilidades en el juego.

Otros sistemas similares

Facebook también ha desarrollado su propio programa para jugar Go, llamado darkforest. Aunque es un programa fuerte contra otras inteligencias artificiales de Go, hasta principios de 2016, aún no había logrado vencer a un jugador humano profesional.

Enfrentamiento histórico: AlphaGo vs. Lee Sedol

El enfrentamiento entre AlphaGo y Lee Sedol fue un evento muy importante en la historia de la inteligencia artificial y el Go.

El encuentro
Partida no. Fecha Negras Blancas Resultado Movimientos
1 9 de marzo de 2016 Lee Sedol AlphaGo B+abandono 186
2 10 de marzo de 2016 AlphaGo Lee Sedol N+abandono 211
3 12 de marzo de 2016 Lee Sedol AlphaGo B+abandono 176
4 13 de marzo de 2016 AlphaGo Lee Sedol B+abandono 180
5 15 de marzo de 2016 Lee Sedol AlphaGo B+abandono 280
Resultado:
AlphaGo 4 – 1 Lee Sedol

Galería de imágenes

Véase también

Kids robot.svg En inglés: AlphaGo Facts for Kids

  • AlphaGo versus Lee Sedol
  • Cumbre del Futuro de Go
  • Deep Blue (computadora)
  • Watson (inteligencia artificial)
  • AlphaGo (película)
  • Lista de proyectos de inteligencia artificial
kids search engine
AlphaGo para Niños. Enciclopedia Kiddle.