Tema: G-Pass@k
2025
G-Pass@k: Redefiniendo la Evaluación de los Modelos de Lenguaje
La nueva métrica G-Pass@k muestra grietas en la estabilidad de desempeño de los modelos de lenguaje actuales.
La nueva métrica G-Pass@k muestra grietas en la estabilidad de desempeño de los modelos de lenguaje actuales.