
La nueva IA de Meta nos acerca a un traductor universal de idiomas
julio 6, 2022
Meta ha dado un paso más hacia la creación de un traductor universal de idiomas.
La empresa ha abierto un modelo de IA que traduce más de 200 idiomas, muchos de los cuales no son compatibles con los sistemas existentes.
La búsqueda es parte de una iniciativa Meta lanzada a principios de este año.
«Llamamos a este proyecto No Language Left Behind, y las técnicas de modelado de IA que usamos de NLLB nos están ayudando a hacer traducciones de alta calidad en Facebook e Instagram para los idiomas que hablan miles de millones de personas en todo el mundo. ”, dijo el CEO de Meta, Mark Zuckerberg, en una publicación de Facebook. Publicar.
NLLB se enfoca en idiomas de bajos recursos, como el maorí o el maltés. La mayoría de las personas en todo el mundo hablan estos idiomas, pero carecen de los datos de capacitación que suelen necesitar las traducciones de IA.
El nuevo modelo de Meta fue diseñado para superar este desafío.
Para ello, los investigadores primero entrevistaron a hablantes de idiomas desatendidos para comprender sus necesidades. Luego desarrollaron una nueva técnica de minería de datos que genera oraciones de entrenamiento para lenguas de escasos recursos.
Luego, entrenaron su modelo en una combinación de datos extraídos y datos traducidos por humanos.
El resultado es NLLB-200: un sistema de traducción multilingüe masivo para 202 idiomas.
El equipo evaluó el desempeño del modelo en el conjunto de datos FLORES-101, que califica las traducciones de idiomas de bajos recursos.
“A pesar de duplicar la cantidad de idiomas, nuestro modelo final funciona un 40 % mejor que el estado del arte anterior en Flores-101”, escribieron los autores del estudio.
Las técnicas ya han mejorado las traducciones automáticas en Facebook, Instagram y Wikipedia. Meta también tiene código abierto todos sus puntos de referencia, secuencias de comandos de datos y modelos para respaldar futuras investigaciones.
Esto, por supuesto, también podría beneficiar a Meta.
Código abierto para todos
El impulso de Zuckerberg por un crecimiento implacable se ha topado recientemente con obstáculos. En febrero, Facebook perdió usuarios diarios por primera vez en sus 18 años de historia.
Si Meta puede mejorar la calidad de sus traducciones, puede hacer que sus aplicaciones sean atractivas para una base de usuarios más amplia.
Inevitablemente, la empresa predice que la búsqueda jugará un papel importante en el metaverso, donde las preocupaciones sobre la inclusión están creciendo. Pero también puede beneficiar a las aplicaciones empresariales existentes.
Los problemas de traducción han causado problemas a Meta durante mucho tiempo. En 2017, la policía israelí arrestó a un hombre palestino después de que Facebook tradujera un mensaje que decía «hola» como «atacadlos».
La compañía también ha tenido problemas para controlar la información errónea y el discurso de odio en idiomas con recursos limitados.
La nueva investigación podría mitigar estos riesgos y mejorar las experiencias de los usuarios. Para crédito de Meta, la empresa también le dio a sus rivales la oportunidad de beneficiarse del trabajo. Se espera que el código abierto de los modelos también sea compatible con hablantes de idiomas desatendidos o en peligro.
Si es así, los beneficios de Meta también podrían beneficiar a la humanidad. También acerca la fantasía de un traductor universal a la realidad.