Solo noticias

y ya

viernes 11 de de 2024

AGENT BANK: Potenciando Modelos de Lenguaje Abiertos

Recientemente, se ha presentado AGENT BANK, la mayor colección hasta la fecha de interacciones de datos para el ajuste preciso de modelos de lenguaje de gran tamaño abiertos, conocida por albergar más de 50,000 trayectorias de interacción en 16 tareas distintas que engloban cinco dimensiones clave de habilidades de agentes. Esta iniciativa tiene como objetivo potenciar las capacidades de agentes en modelos de lenguaje abiertos, que, hasta ahora, han mostrado limitaciones cuando se les compara con modelos propietarios como GPT-3.5 o GPT-4.

El enfoque de mejorar a través de lo que los autores denominan “Trajectory Tuning”, ha demostrado que aumentan de manera notable las habilidades generales de los agentes. Con un enfoque innovador en el etiquetado de trayectorias, el AGENT BANK se ha consolidado como una herramienta esencial para refinar modelos de lenguaje y mitigar el sesgo de dificultad. Además, los datos recopilados se han utilizado para afinar los modelos a través de una suite denominada S AMOYED, que en pruebas comparativas, ha superado a modelos como GPT-3.5-Turbo en tareas “held-in”, lo cual se atribuye al uso de trayectorias ajustadas al dominio.

Los análisis comparativos realizados sobre estos modelos destacan la efectividad de escalar el uso de datos de trayectorias de interacción para adquirir capacidades de agente más generalizadas. Otras observaciones clave sugieren que la inteligencia del agente generalizada emerge de la combinación sinérgica de comportamientos más simples, incluyendo razonamiento, programación, y el uso de la web. Estos resultados resaltan la importancia de ofrecer un enfoque robusto en la recopilación de datos para facilitar la evolución y las capacidades de los modelos de lenguaje.

En conclusión, AGENT BANK y, en particular, la serie de modelos S AMOYED, representan un avance significativo en la ampliación de las capacidades de los agentes al tiempo que se utiliza modelos de código abierto. Más allá de su éxito demostrable en sus mejoras genéricas en tareas no vistas, estas innovaciones destacan el valor de una trayectoria exhaustiva en la mejora de las capacidades del agente.