En el mundo de la inteligencia artificial aplicada al arte, un equipo de investigadores ha anunciado el desarrollo de SongComposer, un modelo de lenguaje de gran capacidad diseñado para la composición de canciones integrales, uniendo letras y melodías de manera coherente y simultánea.
Este innovador avance surge en respuesta a la necesidad de un modelo unificado que pueda crear canciones en formato simbólico. Hasta ahora, el campo de la composición automática se había limitado a sub-tareas aisladas, como la generación de melodías a partir de letras o la producción de letras a partir de melodías, sin un marco que las integrara por completo.
SongComposer se destaca por su capacidad de combinar letras y melodías profesionalmente mediante un modelo de lenguaje especializado en música que incorpora tres innovaciones clave. Estas innovaciones incluyen un formato de tupla flexible para el alineamiento de nivel de palabra entre letras y melodías, un vocabulario extendido de tokenizadores que captura la estructura rítmica, y un pipeline multi-etapa que asimila patrones melódicos a nivel de motivo hasta llegar a estructuras de frase.
Los experimentos realizados demuestran que este modelo supera a otros avanzados, como el GPT-4, en diversas tareas relacionadas con la música. Desde la generación de melodías a partir de letras, hasta la creación procedimental de canciones enteras a partir de descripciones textuales, las capacidades de SongComposer prometen revolucionar el campo.
Además de sus proezas técnicas, SongComposer introdujo un nuevo conjunto de datos a gran escala, diseñado para entrenar modelos de lenguaje de gran envergadura, con letras y melodías emparejadas en inglés y chino. Esto aporta un recurso valioso para futuras investigaciones y contribuciones al campo de la generación musical mediante inteligencia artificial.
En esencia, SongComposer no solo es un hito tecnológico por su capacidad de manejo de elementos musicales complejos sino también una plataforma que permite expandir los límites de la creatividad humana en la música, facilitando a muchos el acceso a herramientas avanzadas de composición musical.
En conclusión, este modelo refleja el potencial de las tecnologías actuales para transformar la creación artística, posibilitando nuevas formas de interacción entre la creatividad humana y las capacidades de las máquinas, lo que anticipa un futuro prometedor en la composición musical asistida por IA.