
DeepMind se pelea con científicos rusos por la investigación de la IA cuántica
agosto 17, 2022
No hay nada más dramático e inspirador que un avance científico. Pero, ¿qué sucede cuando diferentes grupos de científicos no parecen ponerse de acuerdo sobre la ciencia?
DeepMind, una empresa de investigación de Alphabet con sede en Londres, publicó el año pasado un fascinante trabajo de investigación en el que afirmaba haber resuelto el enorme desafío de «simular materia a escala cuántica con IA». Ahora, casi ocho meses después, un grupo de investigadores académicos de Rusia y Corea del Sur puede haber descubierto un problema con la investigación original que arroja dudas sobre la conclusión completa del artículo.
Las implicaciones para esta investigación de vanguardia podrían ser enormes, si los hallazgos del artículo son ciertos. Esencialmente estamos hablando de la posibilidad de usar inteligencia artificial descubrir nuevas formas de manipular los componentes básicos de la materia.
Una nueva esperanza
La gran idea aquí es poder simular interacciones cuánticas. Nuestro mundo está hecho de materia compuesta de moléculas compuestas de átomos. En cada nivel de abstracción, se vuelve más y más difícil de simular.
Cuando alcanzas el nivel cuántico, que existe dentro de los átomos, el problema de simular interacciones potenciales se vuelve increíblemente difícil.
Según una publicación de blog de DeepMind:
Hacer esto en una computadora requiere simular electrones, las partículas subatómicas que gobiernan cómo los átomos se unen para formar moléculas y también son responsables del flujo de electricidad en los sólidos.
A pesar de décadas de esfuerzo y varios avances significativos, modelar con precisión el comportamiento mecánico cuántico de los electrones sigue siendo un desafío abierto.
El problema fundamental es que es realmente difícil predecir las probabilidades de que un determinado electrón acabe en una posición concreta. Y la complejidad aumenta a medida que agrega más.
Como señaló DeepMind en la misma publicación de blog, dos físicos de la década de 1960 lograron un gran avance:
Pierre Hohenberg y Walter Kohn se dieron cuenta de que no es necesario rastrear cada electrón individualmente. En cambio, conocer la probabilidad de que un electrón esté en cada posición (es decir, la densidad electrónica) es suficiente para calcular todas las interacciones con exactitud. Kohn recibió un Premio Nobel de Química después de probar esto, fundando así la Teoría del Funcional de la Densidad (DFT).
Desafortunadamente, DFT solo ha podido simplificar el proceso hasta ahora. La parte «funcional» de la teoría dependía de los humanos para hacer todo el trabajo pesado.
Todo eso cambió en diciembre cuando DeepMind publicó un artículo titulado «Empujando las fronteras de los funcionales de densidad resolviendo el problema de los electrones fraccionados».
En este artículo, el equipo de DeepMind afirma haber mejorado radicalmente los métodos actuales de modelado del comportamiento cuántico mediante el desarrollo de una red neuronal:
Al expresar el funcional como una red neuronal e incorporar estas propiedades exactas en los datos de entrenamiento, aprendemos funcionales libres de grandes errores sistemáticos, lo que da como resultado una mejor descripción de una amplia clase de reacciones químicas.
Los académicos contraatacan
El artículo de DeepMind pasó el proceso de revisión inicial y formal y todo salió bien. Hasta agosto de 2022, un equipo de ocho académicos de Rusia y Corea del Sur publicó un comentario cuestionando su conclusión.
Según un comunicado de prensa del Instituto Skolkovo de Ciencia y Tecnología:
La capacidad de DeepMind AI para generalizar el comportamiento de dichos sistemas no se deriva de los resultados publicados y debe revisarse.
En otras palabras: los académicos cuestionan la forma en que la IA de DeepMind llegó a sus conclusiones.
Según los investigadores que comentaron, el proceso de entrenamiento utilizado por DeepMind para construir su red neuronal le enseñó a memorizar las respuestas a los problemas específicos que iba a enfrentar al realizar la evaluación comparativa, el proceso mediante el cual los científicos determinan si un enfoque es mejor que otro.
En su comentario, los investigadores escriben:
Aunque la conclusión de Kirkpatrick et al. sobre el papel de los sistemas FC/FS en el conjunto de entrenamiento puede ser correcto, esta no es la única explicación posible para sus observaciones.
En nuestra opinión, las mejoras de rendimiento de DM21 en el conjunto de datos de prueba de BBB en comparación con DM21m pueden deberse a una razón mucho más prosaica: una superposición no intencionada entre los conjuntos de datos de entrenamiento y prueba.
Si es cierto, eso significaría que DeepMind en realidad no enseñó una red neuronal para predecir la mecánica cuántica.
El regreso de la IA
DeepMind respondió rápidamente. La compañía publicó su respuesta el mismo día que el comentario y proporcionó una reprimenda inmediata y firme:
No estamos de acuerdo con su análisis y creemos que los puntos planteados son incorrectos o irrelevantes para las principales conclusiones del artículo y la evaluación de la calidad general del DM21.
El equipo amplía esto a lo largo de su respuesta:
DM21 no almacena datos; esto se ilustra simplemente por el hecho de que el DM21 Exc cambia en todo el rango de distancias considerado en BBB y no es igual al límite de separación infinita, como se muestra en la Fig. 1, A y B, para H2+ y H2. Por ejemplo, a 6 Å, DM21 Exc está a ~13 kcal/mol del límite infinito en H2+ y H2 (aunque en direcciones opuestas).
Y, aunque está más allá del alcance de este artículo explicar la jerga anterior, podemos asumir con seguridad que DeepMind probablemente estaba preparado para esta objeción en particular.
Queda por ver si eso resuelve el problema. En este punto, todavía tenemos que ver una refutación del equipo académico para ver si se han disipado sus preocupaciones.
Mientras tanto, es posible que las ramificaciones de esta discusión vayan mucho más allá del simple impacto de un solo artículo de investigación.
A medida que los campos de la inteligencia artificial y la ciencia cuántica se entrelazan cada vez más, también están cada vez más dominados por grupos de investigación corporativos con mucho dinero.
¿Qué sucede cuando hay un callejón sin salida científico (las partes opuestas no logran ponerse de acuerdo sobre la eficacia de un enfoque tecnológico dado a través del método científico) y entran en juego los intereses corporativos?
¿Y ahora?
El quid del problema puede residir en la incapacidad de explicar cómo los modelos de IA «ejecutan los números» para llegar a las conclusiones que obtienen.
Estos sistemas pueden pasar por millones de permutaciones antes de producir una respuesta. Sería imposible explicar cada paso del proceso, que es exactamente por qué necesitamos atajos algorítmicos y de IA para problemas a gran escala de fuerza bruta que serían demasiado grandes para ser resueltos de frente por un humano o una computadora.
Eventualmente, a medida que los sistemas de IA continúan evolucionando, podemos llegar a un punto en el que ya no tengamos las herramientas para comprender cómo funcionan. Cuando esto sucede, es posible que veamos una discrepancia entre la tecnología empresarial y una que pasa la revisión por pares externos.
Eso no quiere decir que el artículo de DeepMind sea un ejemplo. Como escribió el equipo de comentaristas académicos en su comunicado de prensa:
El uso de sistemas de electrones fraccionarios en el conjunto de entrenamiento no es la única novedad en el trabajo de DeepMind. Es probable que su idea de introducir las restricciones físicas en una red neuronal a través del conjunto de entrenamiento, así como el enfoque para imponer el significado físico entrenando en el potencial químico correcto, se utilicen ampliamente en la construcción de funciones DFT de redes neuronales en el futuro.
Pero vivimos en un nuevo y audaz paradigma tecnológico, impulsado por IA. Probablemente sea hora de que comencemos a pensar en cómo será el futuro en un mundo posterior a la revisión por pares.