
Estas redes neuronales saben lo que están haciendo
octubre 14, 2021Las redes neuronales pueden aprender a resolver todo tipo de problemas, desde identificar gatos en fotografías hasta conducir un automóvil autónomo. Pero si estos potentes algoritmos de reconocimiento de patrones realmente comprenden las tareas que realizan, sigue siendo una cuestión abierta.
Por ejemplo, una red neuronal encargada de mantener un automóvil autónomo en su carril podría aprender a hacer esto mirando los arbustos al costado de la carretera, en lugar de aprender a detectar carriles y enfocarse en el horizonte de la carretera.
Los investigadores del MIT han demostrado ahora que cierto tipo de red neuronal es capaz de aprender la verdadera estructura de causa y efecto de la tarea de navegación para la que ha sido entrenado. Debido a que estas redes pueden comprender la actividad directamente a partir de datos visuales, deberían ser más efectivas que otras redes neuronales cuando se navega en un entorno complejo, como un lugar con árboles densos o condiciones climáticas que cambian rápidamente.
En el futuro, este trabajo podría mejorar la confiabilidad y la confiabilidad de los agentes de aprendizaje automático que realizan tareas de alto riesgo, como conducir un vehículo autónomo en una carretera con mucho tráfico.
“Debido a que estos sistemas de aprendizaje automático inspirados en el cerebro son capaces de razonar de manera causal, podemos saber e indicar cómo funcionan y cómo toman decisiones. Esto es esencial para las aplicaciones críticas para la seguridad ”, dice el coautor principal Ramin Hasani, postdoctorado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL).
Los coautores incluyen al estudiante de posgrado en ingeniería eléctrica e informática y coautor Charles Vorbach; El estudiante de doctorado de CSAIL Alessandro Amini; Mathias Lechner, estudiante de posgrado del Instituto Austriaco de Ciencia y Tecnología; y la autora principal Daniela Rus, Andrew y Erna Viterbi, profesora de Ingeniería Eléctrica e Informática y directora de CSAIL. La investigación se presentará en la Conferencia de 2021 sobre sistemas de procesamiento de información neuronal (NeurIPS) en diciembre.
Un resultado que llama la atención
Las redes neuronales son un método para realizar el aprendizaje automático en el que la computadora aprende a completar una tarea mediante prueba y error mediante el análisis de muchos ejemplos de entrenamiento. Y las redes neuronales «líquidas» cambian sus ecuaciones subyacentes para adaptarse continuamente a nuevas entradas.
La nueva investigación se basa en trabajos anteriores en los que Hasani y otros han demostrado cómo un tipo de sistema de aprendizaje profundo inspirado en el cerebro llamado Política de circuito neuronal (NCP), construido a partir de células de redes neuronales líquidas, es capaz de controlar de forma autónoma un vehículo. , con una red de solo 19 neuronas de control.
Los investigadores observaron que los PNC que realizaban una tarea de mantenimiento de carril mantenían su atención en el horizonte y los límites de la carretera cuando tomaban una decisión de conducción, de la misma manera que lo haría (o debería) un ser humano mientras conduce un automóvil. Otras redes neuronales que han estudiado no siempre se han centrado en la carretera.
“Fue una observación interesante, pero no la cuantificamos. Entonces, queríamos encontrar los principios matemáticos de por qué y cómo estas redes pueden capturar la verdadera causalidad de los datos «, dice.
Descubrieron que cuando un PNC está capacitado para completar una tarea, la red aprende a interactuar con el entorno y a tener en cuenta las intervenciones. En esencia, la red reconoce si su salida es modificada por una determinada intervención y luego relaciona causa y efecto.
Durante el entrenamiento, la red corre hacia adelante para generar una salida y luego hacia atrás para corregir errores. Los investigadores observaron que los NCP relacionan causa y efecto durante el modo hacia adelante y el modo hacia atrás, lo que permite que la red preste mucha atención a la verdadera estructura causal de una actividad.
Hasani y sus colegas no necesitaron imponer restricciones adicionales al sistema ni realizar ninguna configuración especial para que el PNC conociera esta causa; surgió automáticamente durante el entrenamiento.
Cambios ambientales de los agentes atmosféricos.
Probaron los NCP a través de una serie de simulaciones en las que drones autónomos realizaban tareas de navegación. Cada dron utilizó las entradas de una sola cámara para navegar.
Los drones tenían la tarea de viajar a un objeto objetivo, perseguir un objetivo en movimiento o seguir una serie de marcadores en varios entornos, incluido un bosque de secuoyas y un vecindario. También viajaron en diferentes condiciones climáticas, como cielos despejados, lluvia intensa y niebla.
Los investigadores encontraron que los NCP se desempeñaban tan bien como otras redes en tareas más simples con buen tiempo, pero las superaban a todas en tareas más desafiantes, como perseguir un objeto en movimiento a través de una tormenta eléctrica.
“Hemos observado que los NCP son la única red que presta atención al objeto de interés en diferentes entornos durante la realización de la tarea de navegación, donde sea que se pruebe y en diferentes condiciones de iluminación o ambientales. Este es el único sistema que puede hacerlo de forma aleatoria y realmente aprender el comportamiento que pretendemos que aprenda el sistema «, dice.
Sus resultados muestran que el uso de NCP también podría permitir que los drones autónomos naveguen con éxito en entornos con condiciones cambiantes, como un paisaje soleado que de repente se vuelve brumoso.
“Una vez que el sistema aprende lo que realmente debería hacer, puede funcionar bien en nuevos escenarios y condiciones ambientales que nunca ha experimentado. Este es un desafío importante de los sistemas actuales de aprendizaje automático que no son causales. Creemos que estos resultados son muy interesantes, ya que muestran cómo puede surgir la causalidad al elegir una red neuronal «, dice.
En el futuro, los investigadores quieren explorar el uso de NCP para construir sistemas más grandes. Reunir miles o millones de redes podría permitirles abordar tareas aún más complicadas.
Esta investigación fue apoyada por el Laboratorio de Investigación de la Fuerza Aérea de los Estados Unidos, el Acelerador de Inteligencia Artificial de la Fuerza Aérea de los Estados Unidos y la Compañía Boeing.