INCREÍBLE

Un robot aprende a jugar al ajedrez en 4 horas

La máquina llamada AlphaZero logró asimilar millones de tácticas y emplear movimientos que ningún ser humano había puesto en práctica en aproximadamente 1.500 años.

El programa de computación AlphaZero, basado en inteligencia artificial, resultó ser el mejor campeón de ajedrez del mundo al vencer a su oponente Stockfish 8, otro sistema que usa el mismo método de aprendizaje, en un maratón de 100 juegos.
 
Lo más insólito de todo es que AlphaZero aprendió por sí solo a jugar al ajedrez en 4 horas. De ese modo, asimiló millones de tácticas y empleó movimientos que ningún ser humano había puesto en práctica en 1.500 años.
 
A pesar de que algunos devotos del ajedrez o fanáticos de la computación podrían celebrar esa hazaña, ciertos expertos están preocupados por la posibilidad de que los robots se vuelvan tan complejos que los ingenieros que los crearon no los entiendan ni sepan predecir cómo funcionarán.
 
AlphaZero fue creado en Londres por la compañía DeepMind, como una herramienta para resolver problemas matemáticos. La máxima expresión de inteligencia artificial de este aparato es que conociendo solo un par de datos tiene la capacidad de reprogramarse a sí misma con nuevos conocimientos, es decir, tomar conclusiones de acuerdo a sus conocimientos.
 
En 2014, Google compró esa firma por 400.000.000 de libras esterlinas, más de US$534.000.000.
 
Lo que más sorprende a los científicos es que la máquina puede multiplicar sus conocimientos a una velocidad imposible para el cerebro humano.
 
Aunque la inteligencia artificial sorprende por los efectos adversos que podría tener para la humanidad, lo ideal es que sea utilizada en áreas como la medicina, tomando decisiones de vida o muerte con mayor claridad que un ser humano.
 
Cuando el gran maestro de ajedrez Garry Kaspárov fue derrotado por la supercomputadora Deep Blue de la compañía IBM en 1997, declaró: "La capacidad de una máquina para superar siglos de conocimiento humano... es una herramienta que cambia el mundo".
 
 
Simon Williams, otro gran maestro británico, afirmó en tono de broma que este acontecimiento merece plasmarse en los libros de historia y bromeó con el hecho de que AlphaZero tomó el mundo del ajedrez, finalmente resolvió el juego y esclavizó a la raza humana como mascotas.
 
 
Con 10 años retirado del ajedrez por computadora, Chrilly Donninger habla de lo que piensa sobre Alpha Zero y el anuncio de ser el mejor jugador de ajedrez en el mundo.
 
Chrilly Donninger es un especialista en el ajedrez computarizado. Creó el programa Nimzo, que fue uno de los animadores en las competencias entre humanos y máquinas, a finales del siglo pasado. Después de eso, creó un sistema llamado Hydra, que no perdió una sola partida contra jugador humano. El gran maestro Michael Adams sólo pudo sacarle al programa 2 empates en 6 partidas, perdiendo las otras 4.
 
 
Donninger está retirado de la programación en ajedrez, pero ha dado su opinión al respecto de Alpha Zero. Por ejemplo, indica que lo que le ha sorprendido es el hecho de que la búsqueda por el sistema Montecarlo haya funcionado muy bien. En general se usa la búsqueda alfa-beta, en donde se crea el árbol de variantes hasta cierta profundidad y entonces se evalúan los nodos terminales. Esta evaluación es el corazón de los programas de ajedrez y contienen ya mucha información ajedrecística de forma numérica.
 
En el sistema Montecarlo, las variantes se juegan hasta el final. La idea es que si después del movimiento A se ganaba el 60% de las partidas, esto debía ser mejor que el movimiento B, en donde se ganaban solamente el 40% de las partidas. Dice Donninger: “En el caso del ajedrez, tras la búsqueda normal, se suele continuar con una búsqueda de la tranquilidad. Es decir, se vuelven a mirar aquellos movimientos que sirvan para capturar piezas. Si a ese respecto ya no se encuentra nada, entonces la posición se evalúa como “tranquila”. No existe nada comparable en el Go. La cuestión es bajo qué criterios se terminará la partida.”
 
Donninger indica que en su momento él también intentó usar la búsqueda Montecarlo, sobre todo en los siempre difíciles finales de torres, pues la búsqueda alfa-beta no funcionaba tan bien en ese sentido. Pero eventualmente el especialista terminó pensando “¡Me ca.. en los finales de torres… Destrozaremos a nuestros rivales antes de llegar a eso!”.
 
Por otra parte, la información de que Alpha Zero lo ha aprendido todo en un día, debía ponerse en un contexto. DeepMind tenía a su disposición 5 mil TPU (hardware desarrollado por Google para el “aprendizaje profundo”). Los TPUs son más potentes que los CPUs. Además, decir que Alpha Zero juega mejor que los humanos ya se había hecho desde hace tiempo. “Alpha Zero juega un poco mejor que el programa más fuerte de ajedrez, Stockfish y éste juega infinitamente más fuerte que el 99% de los jugadores en el mundo”. i ndicó el especialista.
 
Donninger concluye que, por una parte, el sistema Alpha Zero funciona en condiciones totalmente ajenas a la mayoría de los sistemas que pueden usar los programadores y que, por otra parte, “A mí me parece mucho más interesante el juego de la bolsa. Otra cosa interesante sería póker”.