Artículo de información
José Carlos Botto Cayo y Abel Marcial Oruna Rodríguez
26 de junio del 2023
La traducción automática neuronal es una innovadora tecnología basada en redes neuronales artificiales. En los últimos años, ha experimentado avances significativos gracias al desarrollo de la inteligencia artificial. Actualmente, se utiliza como herramienta complementaria en ciertas traducciones profesionales. Es evidente que la tecnología continúa evolucionando y constantemente nos sorprende con sus grandes avances. El campo de la traducción no es una excepción, ya que también se ve influenciado por el progreso tecnológico (ATLS, 2021).
Los idiomas en el mundo actual
La diversidad de idiomas en el mundo enfrenta una amenaza de desaparición y las limitaciones de la tecnología actual de reconocimiento y generación de voz podrían acelerar esta preocupante tendencia. Con el objetivo de facilitar el acceso a la información y el uso de dispositivos en el idioma preferido de las personas, se ha anunciado el lanzamiento de una serie de modelos de inteligencia artificial (IA). Los modelos de Discurso Altamente Multilingüe (MMS) han logrado una expansión significativa de la tecnología de texto a voz y de voz a texto, pasando de alrededor de 100 idiomas a más de 1,100, lo que representa un aumento de más de diez veces en comparación con las capacidades anteriores. Además, estos modelos tienen la capacidad de identificar más de 4,000 idiomas hablados, un avance impresionante que multiplica por cuarenta la capacidad anterior. La tecnología de voz tiene diversas aplicaciones, desde el ámbito de la realidad virtual y aumentada hasta los servicios de mensajería, permitiendo su utilización en el idioma preferido de cada individuo y garantizando la comprensión de todas las voces. Para fomentar la colaboración y el avance en este campo, los investigadores están compartiendo los modelos y el código en código abierto, brindando a otros especialistas la oportunidad de construir sobre este trabajo y contribuir a la preservación de los idiomas del mundo, al mismo tiempo que acercamos a las personas a través de la tecnología (Varios, 2023).
Meta y el lenguaje
La empresa Meta señala que su entrenamiento se basó en libros traducidos a múltiples idiomas. “Recopilar datos de audio para miles de idiomas fue nuestro primer desafío, ya que los conjuntos de datos de voz más extensos cubrían solo hasta 100 idiomas. Para superar este obstáculo, recurrimos a textos religiosos, como la Biblia, que han sido traducidos a numerosos idiomas y ampliamente estudiados en investigaciones de traducción basadas en texto”, asegura (Redacción, 2023).
Además, se pudo obtener una gran cantidad de material en formato de audio debido a que los textos religiosos suelen ser grabados para personas con discapacidades visuales. “Estas traducciones cuentan con grabaciones de audio disponibles públicamente, en las que personas leen los textos en distintos idiomas. Como parte del proyecto MMS, creamos un conjunto de datos que consiste en lecturas del Nuevo Testamento en más de 1,100 idiomas, lo que proporcionó un promedio de 32 horas de datos por idioma”, agrega (Redacción, 2023).
Aunque la mayoría del contenido es de naturaleza religiosa, Meta asegura que esto no afecta al modelo de IA. “Al considerar grabaciones sin etiquetas de otras lecturas religiosas cristianas, hemos aumentado la cantidad de idiomas disponibles a más de 4,000. Si bien estos datos pertenecen a un dominio específico y a menudo son leídos por voces masculinas, nuestro análisis muestra que nuestros modelos funcionan igual de bien para voces masculinas y femeninas. Además, a pesar de que el contenido de las grabaciones de audio es religioso, nuestro análisis demuestra que esto no sesga el modelo para producir un lenguaje más religioso”, concluye (Redacción, 2023).
Google y el lenguaje artificial
Google ha desarrollado un sistema de traducción basado en inteligencia artificial que no solo traduce idiomas, sino que es capaz de crear una lengua artificial propia. Este sorprendente avance se produjo al eliminar el inglés como puente intermedio en la traducción entre japonés y coreano, lo que llevó al sistema a generar una interlingua única. Aunque no se puede determinar el contenido exacto de esta lengua artificial debido a la complejidad de los procesos internos de las redes neuronales, este desarrollo plantea la posibilidad de que las máquinas puedan comunicarse entre sí de manera ininteligible para los humanos. Aunque aún queda mucho por descubrir, este avance demuestra la capacidad de los modelos de inteligencia artificial para aprender y representar conceptos lingüísticos de manera sorprendente (Pastor, 2022).
VALL-E de Microsoft
Microsoft ha presentado una nueva versión de su modelo de inteligencia artificial llamado VALL-E X, que permite a los usuarios traducir su voz a otros idiomas. Este modelo amplía las capacidades de VALL-E, presentado anteriormente, que puede imitar cualquier voz y trasladarla a un nuevo audio. Ahora, VALL-E X no solo imita la voz, sino que también puede traducir utilizando esa misma voz, superando así la barrera del idioma. Lo más sorprendente es que este modelo puede emular emociones en la voz, lo que hace que los resultados sean aún más realistas. VALL-E X utiliza secuencias de fonemas y tokens acústicos para producir audio en el idioma seleccionado, y lo logra sin requerir datos de habla multilingüe de los mismos hablantes para el entrenamiento. Los investigadores han publicado demostraciones de estas capacidades, mostrando traducciones de un idioma a otro con control de acentos y mantenimiento de las emociones en la voz. Este avance representa un gran paso en la eliminación de las barreras lingüísticas y supone un desafío para Google, que también ha estado trabajando en funciones de traducción (Fernández, 2023).
Reflexiones sobre la inteligencia artificial
La inteligencia artificial se está consolidando como una poderosa herramienta que se está expandiendo en todos los aspectos de nuestra vida cotidiana. Uno de los campos en los que está demostrando su valía es en la traducción de textos de manera sonora, brindándonos una ayuda invaluable al enfrentarnos a videos en otros idiomas. Gracias a esta tecnología, ahora podemos aprovechar al máximo el contenido audiovisual al reproducirlo en nuestra computadora, ya que las aplicaciones respectivas nos ofrecen la posibilidad de acceder a traducciones tanto en forma de texto como en audio.
Este logro en la traducción oral marca un importante avance en nuestra aptitud para comprender y establecer comunicación en un mundo cada vez más interconectado. Al poner en práctica esta tecnología, nos abrimos a nuevas oportunidades de aprendizaje, entretenimiento y conexión con personas de diferentes culturas y lenguajes. No solo podemos disfrutar de los videos en otros idiomas, sino que también podemos comprenderlos plenamente, gracias a la traducción en tiempo real que nos brinda la inteligencia artificial. Estamos presenciando cómo la IA transforma nuestra experiencia audiovisual y amplía nuestras posibilidades de comunicación en un mundo cada vez más interconectado.
Referencias
ATLS. (7 de Junio de 2021). at-language solutions. Obtenido de Inteligencia artificial en los idiomas: https://www.at-languagesolutions.com/inteligencia-artificial-idiomas/
Fernández, M. (10 de Marzo de 2023). El espanol. Obtenido de VALL-E X es la ampliación del modelo que ya presentó la compañía en enero y que puede traducir lo que digas en otro lenguaje usando tu voz y tu tono.: https://www.elespanol.com/omicrono/software/20230310/rompedor-invento-no-aprender-gracias-inteligencia-artificial/746925427_0.html
Pastor, J. (1 de Octubre de 2022). Xataka. Obtenido de La inteligencia artificial que traduce idiomas en Google también ha creado uno propio: https://www.xataka.com/robotica-e-ia/la-inteligencia-artificial-que-traduce-idiomas-en-google-tambien-ha-creado-uno-propio
Redacción. (23 de Mayo de 2023). El Comercio. Obtenido de Quieren preservar idiomas: Meta ha desarrollado una inteligencia artificial que identifica más de 4.000 lenguas: https://elcomercio.pe/tecnologia/inteligencia-artificial/meta-ha-desarrollado-una-inteligencia-artificial-para-preservar-idiomas-y-que-identifica-mas-de-4000-lenguas-ia-noticia/
Varios. (22 de Mayo de 2023). Meta. Obtenido de Preserving the World’s Language Diversity Through AI : https://about.fb.com/news/2023/05/ai-massively-multilingual-speech-technology/