La era de la inteligencia artificial (IA) está revolucionando cómo abordamos el verificación de datos en entornos multilingües, y una investigación reciente liderada por expertos de la Universidad de Tecnología de Brno y el Kempelen Institute of Intelligent Technologies expone cómo los modelos de lenguaje de gran tamaño (LLM por sus siglas en inglés) pueden transformar esta tarea. La proliferación de información errónea, primordialmente en plataformas de redes sociales, presenta un desafío significativo para los verificadores de datos a nivel global, especialmente cuando dicha información adopta múltiples idiomas y contextos.
Un avance clave en esta investigación es el desarrollo de un sofisticado sistema de recuperación de afirmaciones que permite captar y filtrar datos previamente verificados. Este sistema emplea los LLM para extraer y resumir información de manera eficiente, lo que facilita a los verificadores humanos concentrarse en afirmaciones emergentes y más complejas.
Los especialistas no solo han evaluado este método usando datos automáticos, sino que también han involucrado a verificadores humanos para revisar su pertinencia. Los resultados son prometedores: las máquinas lograron filtrar numerosos verificaciones irrelevantes, optimizando la carga de trabajo y mejorando la velocidad de respuesta ante nuevas afirmaciones en las plataformas de redes sociales.
El estudio también resalta el potencial de un nuevo conjunto de datos, llamado AFP-Sum, que incluye artículos de verificación de datos en hasta 23 idiomas, y cómo este dataset es vital para el entrenamiento y ajuste de modelos de lenguaje multilingües. Los experimentos realizados con más de diez idiomas han demostrado que los modelos multilingües, como el Multilingual E5 Large, pueden superar a sus contrapartes monolingües, como el GTR-T5-Large en ciertas circunstancias.
A pesar de los avances, los desafíos persisten. El trabajo remarcó la dificultad de los LLM para mejorar rendimientos cuando las afirmaciones no han sido previamente verificadas en contextos multilingües. Asimismo, se identificaron inconsistencias en las verificaciones de verdad cuando no se recuperaban afirmaciones relevantes.
Con el surgimiento de herramientas dotadas de IA, el panorama del fact-checking está siendo re-imaginado. Estos progresos no solo aspiran a mitigar los riesgos relacionados con la información errada, sino también a revolucionar la forma en que las sociedades interaccionan con la información pública. Sin embargo, aún resta camino por recorrer para perfeccionar estos procesos, asegurando que el entusiasmo por estas tecnologías se traduzca en herramientas efectivas para los verificadores de hechos alrededor del mundo.