
Olvídate del ajedrez, DeepMind está entrenando su nueva IA para jugar al fútbol
septiembre 4, 2022
Investigadores de DeepMind, el laboratorio de inteligencia artificial del gigante británico, han abandonado los nobles juegos del ajedrez y se han ido por un placer más plebeyo: el fútbol.
La compañía hermana de Google publicó ayer un artículo de investigación y una publicación de blog que lo acompaña que detalla sus nuevas Neural Probabilistic Motor Primitives (NPMP), un método mediante el cual los agentes de inteligencia artificial pueden aprender a operar cuerpos físicos. .
Según la publicación del blog:
Un NPMP es un módulo de control de motores de propósito general que traduce intenciones de motores de corto plazo en señales de control de bajo nivel, y se entrena fuera de línea o a través de RL imitando datos de captura de movimiento (MoCap), grabados con rastreadores en humanos o animales que realizan movimientos. de interés.
¡Gracias por estar con nosotros!
Vea los aspectos más destacados de la conferencia TNW 2022
Adelante: Esencialmente, el equipo de DeepMind creó un sistema de inteligencia artificial que puede aprender a hacer cosas dentro de un simulador físico al ver videos de otros agentes que realizan esas tareas.
Y, por supuesto, si tienes un motor de física gigante y un suministro interminable de robots curiosos, lo único racional que puedes hacer es enseñarle a driblar y disparar:
Según el trabajo de investigación del equipo:
Optimizamos equipos de agentes para jugar fútbol simulado a través del aprendizaje por refuerzo, restringiendo el espacio de la solución al de movimientos plausibles aprendidos utilizando datos de captura de movimiento humano.
Fondo: Para entrenar a la IA para operar y controlar robots en el mundo, los investigadores deben preparar las máquinas para la realidad. Y, fuera de las simulaciones, cualquier cosa puede pasar. Los agentes deben lidiar con la gravedad, las superficies resbaladizas inesperadas y la interferencia imprevista de otros agentes.
El objetivo del ejercicio no es construir un mejor futbolista (Cristiano Ronaldo no tiene nada que temer de los robots, por ahora), sino ayudar a la IA y a sus desarrolladores a descubrir cómo optimizar la capacidad de los agentes para predecir. resultados.
A medida que la IA comienza su entrenamiento, apenas puede mover su avatar humanoide basado en la física en el suelo. Pero, al recompensar a un agente cada vez que su equipo marca un gol, el modelo puede poner los números en movimiento en unas 50 horas. Tras varios días de entrenamiento, la IA comienza a predecir por dónde irá el balón y cómo reaccionarán los demás agentes a su movimiento.
Según el papel:
El resultado es un equipo de futbolistas humanoides coordinados que exhiben un comportamiento complejo a diferentes escalas, cuantificado por una variedad de análisis y estadísticas, incluidos los que se utilizan en el análisis deportivo del mundo real. Nuestro trabajo constituye una demostración integral de la toma de decisiones integrada aprendida a múltiples escalas en un marco de múltiples agentes.
Toma rápida: Este trabajo es bastante genial. Pero no estamos seguros de que esto represente una «demostración completa» de nada. El modelo obviamente es capaz de operar un agente encarnado. Pero, basado en el aparentemente elegido a mano GIF en la publicación del blog, este trabajo aún se encuentra profundamente en la fase de simulación.
La conclusión aquí es que la IA no «aprende» a jugar al fútbol. Es un movimiento brutal dentro de los límites de su simulación. Esto puede parecer un problema menor, pero los resultados son bastante obvios:
El agente de IA de arriba se ve absolutamente aterrorizado. No sé de qué está huyendo, pero estoy seguro de que es lo más aterrador del mundo.
Se mueve como un extraterrestre vistiendo un traje humano por primera vez porque, a diferencia de los humanos, la IA no puede aprender mirando. Sistemas como el formado por DeepMind analizan miles de horas de video y, esencialmente, extraen datos de movimiento sobre el tema del que están tratando de «aprender».
Sin embargo, es casi seguro que estos modelos se volverán más robustos con el tiempo. Hemos visto lo que Boston Dynamics puede hacer con algoritmos de aprendizaje automático y coreografías preprogramadas.
Será interesante ver cómo les va a los modelos más adaptables, como los desarrollados por DeepMind, una vez que se mueven más allá del entorno de laboratorio y en aplicaciones de robots reales.