Tema: Alineación De Valores Humanos
2025
Innovador Método para Garantizar la Seguridad de Modelos de Lenguaje
HC-RLHF, un nuevo enfoque para alinear modelos de lenguaje con un énfasis en seguridad y utilidad
2025
Modelos de Lenguaje Grande: Ética y Dilemas Morales
Estudio revela cómo los LLMs configuran sus juicios éticos en dilemas clásicos