Tema: Razónamiento Complejo
2025
SuperRL: Un Paso Adelante en el Razonamiento de Modelos de Lenguaje
SuperRL transforma el aprendizaje en modelos de lenguaje adaptándose a desafíos de recompensa escasa usando un enfoque híbrido de refuerzo y supervisión.