Solo noticias

y ya

martes 3 de de 2025

Evolución en Traducción Automática de Habla a Habla para Idiomas de Bajos Recursos

Dispositivos para traducción automática de voz en lenguas de bajos recursos reciben resultados prometedores

En un esfuerzo conjunto entre la empresa Bhaasha Sàrl y la HEIG-VD, se ha desarrollado un sistema de traducción automática de voz a voz en lenguas de bajos recursos, específicamente entre el francés y los idiomas turco y pashto. Esta iniciativa busca ofrecer soluciones efectivas en situaciones de interpretación comunitaria, especialmente en el ámbito de la salud y el acceso a derechos fundamentales para minorías étnicas.

El proyecto ha permitido recopilar y anotar datos significativos, lo que ha facilitado el entrenamiento de modelos específicos. Este trabajo muestra que se han probado más de 60 combinaciones diferentes de sistemas, y se han obtenido evaluaciones positivas utilizando métricas automáticas como BLEU y COMET, junto con evaluaciones humanas, para determinar la eficacia de las distintas configuraciones.

El piloto identificó los componentes más prometedores. La mejor combinación para la traducción del turco al francés y viceversa incluyó el sistema ASR Whisper, finamente ajustado, junto con la tecnología de traducción automática de Google. Este enfoque superó significativamente a otros competidores en precisión y calidad de traducciones.

Para el pashto, la evaluación fue más complicada debido a la escasez de datos. Sin embargo, las soluciones de Microsoft combinadas con su traducción automática demostraron ser el enfoque más prometedor, aunque la calidad todavía presenta desafíos.

La precisión del reconocimiento de voz (WER) mostró que, para el francés y el turco, Whisper superó a competidores, como Microsoft y Google. En cambio, para el pashto, el sistema de Microsoft mantuvo la primacía. En la clasificación de traducciones, Google y Microsoft se destacaron, relegando a otras opciones como NLLB.

Las evaluaciones también consideraron la calidad de síntesis de voz, donde tanto las opciones de Google como de Microsoft fueron bien recibidas, sin diferencias significativas entre ambas en términos de veracidad de la entonación.

Finalmente, se validó el enfoque propuesto mediante la colaboración de evaluadores humanos, quienes corroboraron que los sistemas implementados tienen la capacidad de comunicar adecuadamente el significado de las conversaciones con un alto nivel de corrección gramatical.

Con estas conclusiones, el proyecto sienta bases sólidas para el desarrollo de sistemas de interpretación automatizados para lenguas menos favorecidas, sugiriendo direcciones futuras hacia la integración y uso ampliado en aplicaciones reales, considerando factores críticos como la privacidad y costos asociados a su implementación.