Nacionales

Modelo de traducción guaraní-español gana premio internacional

Un equipo liderado por el investigador paraguayo Marvin Matías Agüero-Torales recibió el premio al mejor artículo en la Conferencia NAACL 2024 por su innovador modelo de traducción automática guaraní-español basado en gramática y datos sintéticos.

Compatriotas ganadores. Foto: ÚH.

Un destacado logro en el campo de la lingüística computacional fue alcanzado por un equipo internacional liderado por el investigador paraguayo Marvin Matías Agüero-Torales. Su innovador trabajo en la traducción automática del guaraní al español fue galardonado con el premio al mejor artículo en la Conferencia Anual 2024 del Capítulo Norteamericano de la Asociación de Lingüística Computacional (NAACL).

El proyecto, titulado “Aumento de datos basado en gramática para idiomas de bajos recursos: El caso de la traducción automática neuronal guaraní – español”, es fruto de una colaboración internacional que incluye a investigadores de la Universidad de la República Uruguay.

La conferencia NAACL, celebrada del 16 al 21 de junio en la Ciudad de México, es considerada una de las más prestigiosas en el campo de la lingüística computacional. Este año, el evento puso especial énfasis en las lenguas indígenas y autóctonas de América.

Lea más: Tesis paraguaya sobre plantas nativas gana premio en Francia

El equipo enfrentó el desafío de la escasez de recursos digitales escritos en guaraní, un idioma ampliamente hablado, pero con limitada presencia en el ámbito digital. Para superar esta barrera, los investigadores emplearon técnicas clásicas basadas en gramática para generar datos sintéticos, creando un corpus paralelo en guaraní y español que permitió entrenar y mejorar los modelos de traducción automática.

Agüero-Torales, hablante nativo de guaraní, desempeñó un papel crucial en la validación y mejora de las reglas gramaticales utilizadas para generar los datos sintéticos. Su experiencia lingüística combinada con la experticia técnica del equipo resultó en un modelo que, según se informa, supera en algunos casos al traductor de Google.

El proyecto, que se desarrolló a lo largo de tres años, nació de una colaboración iniciada tras la conferencia NAACL de 2021. Los investigadores pusieron el modelo a disposición del público en línea.

Unite a nuestro canal de WhatsApp

La importancia de este trabajo trasciende al guaraní, ya que la metodología desarrollada podría aplicarse a otras lenguas indígenas y minoritarias alrededor del mundo. Los investigadores esperan que su trabajo inspire más esfuerzos para preservar y digitalizar lenguas con recursos limitados, contribuyendo así a la diversidad lingüística global en la era digital.

Fuente: Última Hora.