Tema: Evaluación Matemática
2024
Omni-MATH desafía a los modelos de lenguaje con problemas matemáticos a nivel olímpico
Un nuevo benchmark busca evaluar las habilidades de razonamiento matemático de modelos lingüísticos avanzados.
Solo noticias
Un nuevo benchmark busca evaluar las habilidades de razonamiento matemático de modelos lingüísticos avanzados.