Tema: Evaluación De Algoritmos
2024
Nuevo Sistema de Pruebas Revoluciona Evaluación de Modelos de Lenguaje
Investigadores introducen un benchmark dinámico que revela deficiencias ocultas en modelos de lenguaje
2024
Alucinaciones Gráficas en Modelos de Lenguaje: Un Nuevo Enfoque Estructural
Investigadores revelan inconsistencias en los modelos de lenguaje al reproducir gráficos conocidos, proponiendo nuevas métricas de evaluación