Solo noticias

y ya

martes 3 de de 2025

NaijaVoices: Revolucionando el Reconocimiento del Habla para Lenguas Africanas

Recientemente se ha presentado el NaijaVoices Dataset como un avance significativo en el panorama de la tecnología del habla multilingüe para idiomas africanos. Este conjunto de datos se destaca por su enfoque innovador de la “agricultura de datos”, implicando una relación recíproca con las comunidades ligadas al idioma, asegurando que estas últimas sean involucradas y beneficiadas en el proceso.

Comenzando por la fase de generación de oraciones, expertos en los idiomas y hablantes nativos, denominados ‘Generadores de Oraciones’, se encargaron de crear nuevas sentencias basadas en temas y sugerencias específicas. Esto resultó en la creación de más de 1,9 millones de textos ricos y culturalmente auténticos, destacando las estrategias innovadoras del proyecto que incluyeron el uso de elementos culturales como los sistemas de conteo tradicionales y la consulta a fuentes antiguas de información.

Durante la fase de grabación, se utilizaron Facilitadores entrenados en habilidades técnicas y lingüísticas para asegurar la obtención de grabaciones de alta calidad. La meta fue reunir a más de 5,000 donantes de voz dentro de un marco temporal de tres meses, una hazaña alcanzada gracias a un enfoque que combinó la capacitación y la estrecha supervisión de los participantes.

El dataset NaijaVoices comprende más de 1,800 horas de datos de audio recogidos de 5,455 locutores, presentando una inmensa diversidad acústica y especificidades únicas en cada grabación. Para demostrar su utilidad, se realizaron experimentos de reconocimiento automático del habla (ASR), donde el conjunto de datos sirvió para afinar múltiples modelos existentes, resultando en una notable reducción de los índices de error de palabras, ofreciendo así una hoja de ruta hacia la mejora de tecnologías de voz multilingües.

Por último, este esfuerzo no solo pone de manifiesto la fortaleza de generar datos de reconocimiento de voz en gran escala cuatro idiomas africanos, sino que también ilumina el camino a una inclusión más rica y comprensiva de estas lenguas en tecnologías emergentes, logrando finalmente levantar el estatus de “bajo recurso” que injustamente se ha asignado a estas lenguas.