Tema: Estrategias De Evaluación
2025
LiveIdeaBench: Evaluando la Creatividad de los LLMs en Ciencia
Un nuevo benchmark explora el potencial creativo de los Modelos de Lenguaje a Gran Escala en la generación de ideas científicas.
Un nuevo benchmark explora el potencial creativo de los Modelos de Lenguaje a Gran Escala en la generación de ideas científicas.