En el contexto de Nigeria, país con una diversidad lingüística impresionante, se detalla el análisis sobre dos variedades del pidgin: el West African Pidgin English (WAPE) y el Nigerian Pidgin, conocido como Naija. Ambos son pidgins hablados por millones, pero distintas plataformas y colectivos los presentan de manera diversa. WAPE, empleado por la BBC para alcanzar una audiencia más amplia, cuenta con un mayor respaldo en términos de datos disponibles en la web. Sin embargo, Naija, con un aproximado de 120 millones de hablantes, aunque ampliamente utilizado en la vida diaria, carece de ese mismo nivel de representatividad digital.
A través de experimentos de traducción y análisis estadísticos, se ha comprobado que WAPE y Naija, si bien tienen un grado de comprensión mutua, presentan diferencias lingüísticas sustanciales, lo que se hace evidente en el orden de palabras y la elección de vocabulario. Esta distinción se torna importante cuando se considera la enseñanza de los modelos de inteligencia artificial generativa, que en este momento operan principalmente con el WAPE.
El análisis cuantitativo revela que el modelo de traducción máquina ajustado con datos de WAPE muestra un rendimiento significativamente superior al ser comparado con traducciones hacia Naija. Las similitudes estadísticas con el inglés demuestran que WAPE está más cercano al lenguaje estándar que Naija, lo cual facilitan su procesamiento por las inteligencias artificiales.
A nivel educativo, las instituciones de tradición angloparlante podrían argumentar que estas diferencias reflejan una brecha de recursos y representación en los modelos multilingües que deben considerar tanto la inclusión como la adecuación cultural hacia usuarios de diferentes tribus nigerianas. _]
Generar conocimiento representativo de la diversidad lingüística, particularmente el aspecto de pidgins y creoles, es crucial en un mundo interconectado donde la inteligencia artificial juega un papel preponderante. Afianzar modelos de IA que integren dialectos como el Naija puede ofrecer una verdadera representación del abanico lingüístico nigeriano, ajustando estos sistemas no solo hacia el inglés simplificado que predomina, sino también hacia las variantes locales más dispersas y culturalmente significativas.