Un algoritmo logra un dominio sobrehumano del ajedrez, el go y el shogi tras entrenar por sí mismo.
Un algoritmo de inteligencia artificial ha derrotado en los tres juegos de mesa más complejos a los mejores programas y lo ha hecho aprendiendo por sí mismo, sin ayuda humana. AlphaZero, un algoritmo creado por la empresa DeepMind, con sede en Londres (Reino Unido), ha adquirido un dominio sobrehumano del ajedrez, el go y el shogi –el ajedrez japonés– en unas pocas horas y sin tomar en cuenta el conocimiento sobre estos tres juegos que la humanidad ha desarrollado a lo largo de siglos. El avance se presenta hoy en la revista Science .
La mayoría de programas de inteligencia artificial que dominan juegos de mesa aprenden a partir de información sobre partidas jugadas por personas. Así lo hizo Deep Blue, el programa de IBM que en 1997 derrotó a Gary Kasparov, el entonces campeón mundial de ajedrez. También fue el caso de AlphaGo, un algoritmo de DeepMind que en 2016 venció a Lee Sedol, campeón de go, un juego altamente estratégico que requiere de una capacidad de computación mucho mayor que el ajedrez.
En 2017, un nuevo algoritmo de DeepMind, AlphaGo Zero, se convirtió en el mejor jugador de go del mundo al derrotar a AlphaGo. Pero, a diferencia de todos los campeones hasta la fecha, AlphaGo Zero alcanzó su maestría sin aprender de nadie. Partiendo solo de las reglas del juego, se entrenó jugando partidas contra sí mismo y en tan solo tres horas estuvo preparado jugar contra AlphaGo, al que venció por cien a cero en cien partidas.
El estilo de juego de AlphaZero ha llamado la atención de profesionales de primer nivel del ajedrez y el shogi
AlphaZero es una versión mejorada de AlphaGo Zero que no solo ha aprendido de forma autónoma a dominar el go, sino también a ajedrez y a shogi. Con un entrenamiento de unas pocas horas, ha aprendido a jugar a un nivel suficiente para derrotar a los mejores programas de inteligencia artificial especializados en los tres juegos de mesa, incluido el propio AlphaGo Zero.
Por otra parte, el estilo de juego de AlphaZero ha llamado la atención de profesionales de primer nivel del ajedrez y el shogi. “No puedo disimular mi satisfacción al ver que juega con un estilo muy dinámico, muy parecido al mío”, declara Gary Kasparov en un comunicado difundido por DeepMind. “Su estilo de juego único nos muestra que hay nuevas posibilidades para el juego del shogi”, señala en la misma nota Yoshinaru Habu, el único jugador que ha ostentado los siete títulos principales de shogi.
Los juegos de mesa son un terreno de entrenamiento para desarrollar herramientas de inteligencia artificial que se pueden aplicar a otros ámbitos
Los juegos de mesa son un terreno de entrenamiento útil para la inteligencia artificial porque se basan en unas reglas muy determinadas y en información que está totalmente disponible en el tablero. “Mi sueño es ver el mismo tipo de sistema aplicado no solo a los juegos de mesa, sino también a todo tipo de aplicaciones en el mundo real, por ejemplo en el diseño de nuevos fármacos o materiales”, afirma en un comunicado David Silver, de DeepMind, quien ha dirigido la investigación.
“Este trabajo ha cerrado un capítulo de varias décadas en la investigación en inteligencia artificial. Los investigadores deberán mirar hacia una nueva generación de juegos para buscar nuevos retos”, escribe Murray Campbell, investigador de IBM en Yorktown Heights (Estados Unidos) que no ha participado en el trabajo, en un artículo de opinión publicado en Science. Una posibilidad para el futuro serán los videojuegos multijugador.