AlphaGo para niños
AlphaGo es un programa de inteligencia artificial creado por Google DeepMind. Su propósito principal es jugar al Go, un antiguo juego de mesa de estrategia. En octubre de 2015, AlphaGo hizo historia al ser la primera máquina de Go en vencer a un jugador profesional sin ninguna ventaja inicial en un tablero grande de 19x19.
AlphaGo se enfrentó al jugador profesional chino Fan Hui en una serie de cinco partidas oficiales, ganándolas todas. Luego, en marzo de 2016, se midió con uno de los mejores jugadores del mundo, Lee Sedol. AlphaGo ganó la primera partida de este emocionante encuentro. En ese momento, AlphaGo estaba considerado como el segundo mejor jugador de Go del mundo en un ranking no oficial. Por su victoria contra Lee Sedol, AlphaGo recibió un honorario 9-dan, que es el rango más alto en el Go, otorgado por la Asociación Coreana de Baduk.
En 2017, otra versión llamada AlphaZero, también de DeepMind, superó a AlphaGo Zero y a otros programas de ajedrez y Shōgi (un juego de mesa japonés similar al ajedrez). AlphaZero logró un nivel de juego superior al humano después de solo 4 horas de entrenamiento.
Contenido
¿Cómo funciona AlphaGo?
AlphaGo utiliza computadoras muy potentes para funcionar. Se probó en diferentes configuraciones, usando muchas CPU y GPU. Estas son como los "cerebros" de la computadora que le permiten pensar y calcular. AlphaGo tenía solo dos segundos para decidir cada movimiento en el juego.
Aquí puedes ver cómo las diferentes configuraciones de hardware afectaron su rendimiento, medido con un sistema de puntos llamado Elo:
Configuración | Hilos de búsqueda |
N.º de CPU | N.º de GPU | Ranking de Elo |
---|---|---|---|---|
Asíncrono | 40 | 48 | 1 | 2,151 |
Asíncrono | 40 | 48 | 2 | 2,738 |
Asíncrono | 40 | 48 | 4 | 2,850 |
Asíncrono | 40 | 48 | 8 | 2,890 |
Distribuido | 12 | 428 | 64 | 2,937 |
Distribuido | 24 | 764 | 112 | 3,079 |
Distribuido | 40 | 1,202 | 176 | 3,140 |
Distribuido | 64 | 1,920 | 280 | 3,168 |
También hubo diferentes versiones de AlphaGo, cada una más fuerte que la anterior:
Versiones | Hardwares | Elo | Partidos |
---|---|---|---|
AlphaGo Fan | 176 GPUs, distribuido | 3.144 | 5:0 contra Fan Hui |
AlphaGo Lee | 48 TPUs, distribuido | 3.739 | 4:1 contra Lee Sedol |
AlphaGo Master | Una sola máquina con 4 TPU v2 | 4.858 | 60:0 contra jugadores profesionales;
Cumbre del Futuro de Go |
AlphaGo Zero | Una sola máquina con 4 TPUs v2 | 5.185 | 100:0 contra AlphaGo Lee
89:11 contra AlphaGo Master |
¿Qué es AlphaGo Zero?
El equipo de AlphaGo presentó una versión aún más avanzada llamada AlphaGo Zero en octubre de 2017. Lo especial de AlphaGo Zero es que no aprendió de partidas jugadas por humanos. En cambio, aprendió a jugar Go desde cero, jugando millones de partidas contra sí mismo.
Al jugar contra sí mismo, AlphaGo Zero se hizo increíblemente fuerte. En solo tres días, superó la fuerza de AlphaGo Lee (una versión anterior), ganándole 100 partidas a 0. En 21 días, alcanzó el nivel de AlphaGo Master, y en 40 días, superó a todas las versiones anteriores.
¿Cómo aprende AlphaGo?
El programa de AlphaGo usa una combinación de técnicas de aprendizaje automático y búsqueda en árboles. Esto significa que aprende de la experiencia y explora muchas posibilidades de movimientos en el juego.
Al principio, AlphaGo fue "entrenado" observando cómo jugaban los humanos. Se le mostraron alrededor de 30 millones de movimientos de partidas históricas de Go para que imitara a los jugadores expertos. Una vez que aprendió lo básico, siguió mejorando jugando muchísimas partidas contra sí mismo. Este método se llama aprendizaje por refuerzo, donde el programa aprende de sus propios errores y aciertos.
El estilo de juego de AlphaGo
Los expertos describen el estilo de juego de AlphaGo como muy interesante. Myungwan Kim, un jugador profesional de Go, dijo que jugar contra AlphaGo era como jugar "contra un ser humano". El árbitro de las partidas, Toby Manning, lo describió como un estilo "conservador", lo que significa que AlphaGo jugaba de forma segura y cuidadosa.
El impacto de AlphaGo
AlphaGo ha sido un gran avance en el campo de la inteligencia artificial. Antes de AlphaGo, se pensaba que el juego de Go era demasiado complejo para que una máquina lo dominara por completo.
Los expertos creen que en el futuro, los jugadores de Go podrán usar programas de computadora como AlphaGo para analizar sus propias partidas. Esto les ayudará a entender dónde se equivocaron y cómo pueden mejorar sus habilidades en el juego.
Otros sistemas similares
Facebook también ha desarrollado su propio programa para jugar Go, llamado darkforest. Aunque es un programa fuerte contra otras inteligencias artificiales de Go, hasta principios de 2016, aún no había logrado vencer a un jugador humano profesional.
Enfrentamiento histórico: AlphaGo vs. Lee Sedol
El enfrentamiento entre AlphaGo y Lee Sedol fue un evento muy importante en la historia de la inteligencia artificial y el Go.
Partida no. | Fecha | Negras | Blancas | Resultado | Movimientos |
---|---|---|---|---|---|
1 | 9 de marzo de 2016 | Lee Sedol | AlphaGo | B+abandono | 186 |
2 | 10 de marzo de 2016 | AlphaGo | Lee Sedol | N+abandono | 211 |
3 | 12 de marzo de 2016 | Lee Sedol | AlphaGo | B+abandono | 176 |
4 | 13 de marzo de 2016 | AlphaGo | Lee Sedol | B+abandono | 180 |
5 | 15 de marzo de 2016 | Lee Sedol | AlphaGo | B+abandono | 280 |
Resultado: AlphaGo 4 – 1 Lee Sedol |
Galería de imágenes
Véase también
En inglés: AlphaGo Facts for Kids
- AlphaGo versus Lee Sedol
- Cumbre del Futuro de Go
- Deep Blue (computadora)
- Watson (inteligencia artificial)
- AlphaGo (película)
- Lista de proyectos de inteligencia artificial