Investigadores de la Universidad de Michigan, en colaboración con LG AI Research, han desarrollado un método innovador llamado S PRIG para optimizar los prompts de sistemas en modelos de lenguaje a gran escala (LLM). Este método utiliza algoritmos genéticos para construir de manera iterativa prompts optimizados que maximizan el rendimiento del modelo en una variedad de tareas genéricas. A través de un estudio exhaustivo que evalúa el rendimiento en 47 tipos de tareas diferentes, los investigadores han demostrado que un solo prompt de sistema optimizado puede igualar el rendimiento de los prompts diseñados específicamente para tareas individuales.
Históricamente, la optimización de prompts se ha centrado principalmente en instrucciones específicas para tareas concretas, pero S PRIG ofrece un enfoque diferente al enfocarse en las instrucciones del sistema que preceden a las instrucciones específicas de la tarea. Esto ha mostrado ser efectivo para obtener mejoras en el rendimiento general de los modelos, permitiendo que los LLM manejen eficientemente una gama más amplia de escenarios.
El método desarrollado combina la optimización a nivel de sistema y tarea, logrando mejoras adicionales y demostrando la naturaleza complementaria de ambos enfoques. Las pruebas realizadas indican que estos prompts optimizados por S PRIG se generalizan efectivamente a través de diferentes familias de modelos, tamaños de parámetros y lenguajes, superando incluso metodologías avanzadas existentes en áreas como comprensión lingüística y razonamiento matemático.
Este avance sugiere que la optimización de prompts de sistema puede ser una herramienta poderosa para incrementar la capacidad potencial de los LLM, presentándose como una estrategia valiosa para mejorar el comportamiento del modelo de manera grande y generalizada.
En conclusión, el éxito de S PRIG en la optimización de prompts a nivel de sistema indica un camino prometedor para la investigación en inteligencia artificial, ampliando no solo la aplicabilidad de los LLM en diferentes dominios, sino también proporcionando una plataforma más robusta para futuras innovaciones en el campo de la inteligencia artificial.