Tema: Evaluación Matemática

2024

oct. 11

Un nuevo benchmark busca evaluar las habilidades de razonamiento matemático de modelos lingüísticos avanzados.