IA de Google DeepMind alcanza nivel de Gran Maestro en ajedrez

Investigadores de Google DeepMind han desarrollado un modelo avanzado de lenguaje para dominar juegos de mesa como el ajedrez y el Conecta Cuatro, al combinar la planificación por búsqueda con el conocimiento del dominio. Este nuevo enfoque se basa en modelos de lenguaje grandes (LLMs), permitiéndoles alcanzar niveles de Gran Maestro al integrar técnicas de búsqueda optimizadas con modelos previamente entrenados.

La principal innovación se centra en un modelo de valor multi-acción (MAV), que logra desempeñarse en un nivel impresionante gracias a su capacidad para predecir movimientos legales, rastrear estados de juego y detectar estados terminales. El MAV fue entrenado usando diferentes formatos textuales para representar los estados de los juegos y emplea tanto la búsqueda externa, que utiliza un MCTS (búsqueda del árbol de Monte Carlo), como una búsqueda interna que integra el procedimiento directamente en el LLM.

En cuanto a la búsqueda externa, se ha aplicado una técnica similar a la utilizada por AlphaZero, que combina funciones de política prioritaria y de valor en cada estado, sin necesidad de un motor de juego explícito. Por su parte, la búsqueda interna linializa los árboles de búsqueda, entrenando al modelo en estas representaciones. Esto permite al modelo evaluar y expandir nodos, logrando retroalimentarse de manera efectiva y mejorar la calidad de sus decisiones sin depender de un motor de juego externo.

Los experimentos realizados revelaron un desempeño asombroso del MAV, logrando un nivel cercano al de Gran Maestro de ajedrez al competir en diversas posiciones de juego, superando las capacidades de modelos anteriores y alcanzando un Elo interno notablemente alto. La precisión en la predicción de movimientos y en rastrear los estados FEN (descripción del estado del juego), además de la precisión en la detección de acciones ganadoras, subraya su efectividad.

Este trabajo no sólo está limitado a juegos de mesa, sino que sugiere aplicaciones potenciales más generales, donde la planificación y el razonamiento son críticos. Aunque aún queda por explorar cómo estas capacidades de razonamiento pueden integrarse en modelos futuros para tareas en dominios complejos, los avances actuales destacan el prometedor potencial de los LLMs en la planificación automatizada.

Para concluir, la combinación de técnicas de búsqueda interna y externa con conocimiento del dominio representa un salto significativo en el campo de la inteligencia artificial aplicada a juegos de mesa y potencialmente más allá. Estos descubrimientos podrían servir de base para desarrollar agentes de IA capaces de abordar desafíos aún más complejos en un futuro próximo.

Solo noticias

y ya

IA de Google DeepMind alcanza nivel de Gran Maestro en ajedrez