AlphaGo de Google es como una "civilización alienígena inventando sus propias matemáticas", afirma Nick Hynes del MIT.
El programa de Inteligencia Artificial AlphaGo de Google se ha superado a sí mismo. Si en 2016 nos sorprendió tras derrotar a los mejores jugadores humanos del ancestral juego de mesa chino 'Go' -en el que prima la intuición para ganar-, ahora se presenta con una nueva versión totalmente autodidacta: es más inteligente que nunca y ha aprendido en tres días lo que a la humanidad le ha costado miles de años y, además, sin ninguna ayuda humana.
Y es que la versión actualizada de AlphaGo es completamente autodidacta, un paso importante hacia el surgimiento de máquinas que logran capacidades sobrehumanas "sin aportaciones humanas", según apuntaron los responsables del programa a la revista Nature.
El juego de 'Go', es el desafío más complejo para dos personas que jamás se haya inventado y Alphago Zero lo ha dominado en tres días. Creó sus propios y novedosos movimientos para eclipsar todo el conocimiento que a nosotros tanto nos ha costado obtener. Finalmente, AlphaGo Zero ganó por 100 juegos a 0, venciendo de forma apabullante.
"AlphaGo Zero no solo redescubrió los patrones y aperturas comunes que los humanos tienden a jugar... finalmente los descartó, prefiriendo sus propias variantes que los humanos ni siquiera conocen ni juegan en este momento", dijo David Silver, investigador principal de Alpha Go.
El predecesor de Zero, AlphaGo, era increíble, pero la nueva versión autodidacta ha redefinido su arsenal de entrenamiento al erradicar por completo las enseñanzas humanas de su educación. Cogió las reglas del juego y, sin instrucciones, el sistema aprendió cómo jugar, ideó una estrategia y mejoró mientras compitió contra sí mismo, comenzando con un "juego completamente al azar" para descubrir cómo se ganaba la recompensa.
A diferencia de sus predecesores, AlphaGo Zero "ya no está limitado por los límites del conocimiento humano", escribió el CEO de Silver y DeepMind, Demis Hassabis, en un blog.
En el estudio, los investigadores exponen cómo esa sorprendente autosuficiencia ha 'afilado' la inteligencia de Zero hasta convertirla en devastadora: en 100 juegos no hubo ni una sola victoria contraria. Ni una.
Aún más sorprendente, ese truco se produjo después de solo tres días de entrenamiento de auto-juego de AlphaGo Zero, en el que destilaba el equivalente a miles de años de conocimiento humano del juego.
Aparte de ser autodidacta, el equipo detrás de AlphaGo Zero atribuye su dominio de Go a una red neuronal única mejorada (como si de un cerebro humano se tratara) y a simulaciones de entrenamiento más avanzadas.
En comparación, AlphaGo Zero tenía cuatro unidades de procesamiento de datos y AlphaGo 48; AlphaGo Zero jugó 4,9 millones de juegos de entrenamiento durante tres días y AlphaGo 30 millones de juegos durante varios meses.
Pero solo porque la IA esté avanzando a un ritmo tan asombroso no significa necesariamente que Zero sea más inteligente o más capaz de los humanos en otros campos lejos de este complicado juego de mesa inventado hace más de 2.500 años.
"Sin embargo, este no es el comienzo de ningún fin porque AlphaGo Zero, como todas las otras IA exitosas hasta ahora, es extremadamente limitado en lo que sabe y en lo que puede hacer en comparación con los humanos e incluso con otros animales", aclaró Satinder Singh de la Universidad de Michigan (EE. UU.).
Es posible que no sean capaces de hacer todo lo que los humanos podemos hacer ahora mismo, pero pueden hacer tantas otras cosas que nosotros no podemos... bienvenidos al futuro.
Referencia: Mastering the game of Go without human knowledge, Nature (2017). nature.com/articles/doi:10.1038/nature24270
Crédito imagen: Deepmind
https://www.muyinteresante.es/tecnologia/articulo/la-ia-autodidacta-de-google-ya-no-necesita-a-los-humanos-811508407551