Solo noticias

y ya

miércoles 11 de de 2025

Innovación en Recomendaciones Serendipitosas con MLLM

El equipo de investigadores de Google DeepMind y YouTube ha dado un paso significativo en el mundo de los sistemas de recomendación. Estos expertos han ideado una innovadora estructura de recomendación serendipitosa basada en Modelos de Lenguaje Multimodal (MLLM), conocida por su capacidad de entender distintos tipos de contenido y perfeccionarse para ofrecer sugerencias más inesperadas y originales, llevadas a cabo en una plataforma de videos cortos que atiende a miles de millones de usuarios.

Al integrar el conocimiento global de los MLLM con la eficiencia de los sistemas convencionales, han propuesto un marco jerárquico que guía a los modelos de recomendación hacia pautas más serendipitosas, permitiendo a los usuarios descubrir contenido inédito que estimula su curiosidad y fomenta la exploración. Este enfoque busca equilibrar entre recomendar elementos familiares y aquellos que son una total sorpresa para los usuarios, asegurando un crecimiento enriquecedor de sus preferencias y experiencias.

Mediante experimentos en vivo, se demostró que la incorporación de esta metodología ciertamente mejora los niveles de satisfacción de los usuarios, aumentando la novedad y diversidad de las recomendaciones ofrecidas. Los hallazgos subrayaron que las recomendaciones inesperadas captan mejor la atención de los usuarios en comparación con las basadas exclusivamente en su conducta pasada. Estos modelos aprovecharon las capacidades de razonamiento de los MLLM, permitiendo descubrir clústeres de interés inexplorados, rompiendo así el ciclo repetitivo de las sugerencias basadas en similitudes tradicionales.

A pesar de los desafíos significativos representados por la implementación de modelos MLLM en sistemas de escala industrial, los investigadores lograron sortear la complejidad de procesar vastas acciones de recomendaciones manteniendo el rendimiento y la escalabilidad del sistema. Se utilizó una estructura secuencial con planificación jerárquica, y experimentos offline indicaron que la estrategia de ‘cadena de pensamiento’ permitió un análisis efectivo visual de los elementos de video, superando los resultados obtenidos con simples estrategias unimodales.

En conclusión, esta iniciativa presentada no solo resalta la importancia de integrar modelos MLLM en grandes plataformas de recomendación, sino que también abre un nuevo camino para mejorar la satisfacción y la retención de usuarios a través de introducciones inesperadas a contenidos novedosos y culturalmente enriquecedores. Un enfoque pionero que podría redefinir las conversaciones sobre la forma en que las plataformas digitales interactúan con sus usuarios.