Meta (Facebook) usa la Biblia para entrenar nueva Inteligencia Artificial

biblia inteligencia artificial meta

La empresa matriz de Facebook, Meta, ha dado un paso importante en el mundo de la inteligencia artificial al anunciar un nuevo proyecto llamado Massively Multilingual Speech (MMS), que utiliza pasajes de la Biblia para entrenar su última tecnología de conversión de idiomas.

Este proyecto representa un avance significativo en la capacidad de la inteligencia artificial para comprender y traducir una amplia variedad de idiomas, y según la compañía, supera en 10 veces a los sistemas actuales de conversión de idiomas.

«Recopilar datos de audio de miles de idiomas fue nuestro primer desafío, ya que los mayores conjuntos de datos de voz actuales abarcan, como mucho, 100 idiomas. Para superarlo, recurrimos a textos religiosos, como la Biblia, que se tradujeron a muchos idiomas distintos y cuyas traducciones se estudiaron en profundidad para investigar la traducción de textos lingüísticos», detalló Meta en su blog oficial.

Meta destacó que el MMS se ha convertido en un modelo de IA altamente eficiente y efectivo.

Una de las características más notables de este proyecto es su capacidad para trabajar con un conjunto de datos masivo que incluye lecturas del Nuevo Testamento en más de 1,100 idiomas diferentes. Esto representa una hazaña impresionante en términos de diversidad lingüística y riqueza de datos.

Para entrenar el MMS, Meta utilizó pasajes de la Biblia en varios idiomas, lo que proporcionó una base sólida para enseñar a la inteligencia artificial a comprender y traducir una amplia gama de expresiones y vocabulario.

Biblia e Inteligencia Artificial

Los creadores de Facebook también aclararon que «si bien el contenido de las grabaciones de audio es religioso, nuestro análisis muestra que esto no sesga el modelo para producir un lenguaje más religioso».

«Creemos que esto se debe a que utilizamos un enfoque de clasificación temporal conexionista (CTC), que está mucho más restringido en comparación con los modelos de lenguaje grandes (LLM, por sus siglas en inglés) o los modelos secuencia a secuencia de reconocimiento de voz», aseguran.

Además, estas traducciones no se limitaron solo a texto escrito, sino que también incluyeron grabaciones de audio, lo que permitió al sistema aprender cómo suenan y se pronuncian las palabras en diferentes idiomas.

Un aspecto interesante de este proyecto es que no se limitaron exclusivamente a las lecturas del Nuevo Testamento. Los investigadores de Meta ampliaron aún más su conjunto de datos incorporando grabaciones no etiquetadas de otras lecturas religiosas cristianas. Esto les permitió aumentar el número de idiomas disponibles para su sistema de conversión de idiomas a más de 4,000, lo que demuestra la versatilidad y la amplitud de su enfoque.

El uso de la Biblia y otras lecturas religiosas como base para el entrenamiento del MMS plantea algunas preguntas interesantes sobre la elección de datos y su impacto en la tecnología.

Aunque estas lecturas proporcionan un conjunto de datos rico y diverso, también es importante considerar cómo pueden influir en la interpretación y las traducciones realizadas por la inteligencia artificial. La religión es un tema delicado, y asegurar la neutralidad y la precisión en las traducciones es crucial para garantizar que el MMS sea útil y respetuoso en una variedad de contextos culturales.