Tema: Alineación De Valores Humanos

2025

Innovador Método para Garantizar la Seguridad de Modelos de Lenguaje

jun. 11

HC-RLHF, un nuevo enfoque para alinear modelos de lenguaje con un énfasis en seguridad y utilidad

2025

Modelos de Lenguaje Grande: Ética y Dilemas Morales

abr. 29

Estudio revela cómo los LLMs configuran sus juicios éticos en dilemas clásicos