Solo noticias

y ya

jueves 1 de de 2025

Revolución en compresión de datos con LMCompress

Recientes avances en la comprensión del flujo de datos mediante modelos de lenguaje grandes (LLMs) han generado una revolución en la compresión sin pérdida de datos. Un nuevo método denominado LMCompress promete mejorar drásticamente la eficiencia de la compresión actual, superando a las tradicionales compresiones de estándares como JPEG-XL para imágenes, FLAC para audios y H.264 para videos. Este método de compresión se basa en el principio de que cuanto mejor se comprenda el dato, mejor se podrá comprimir.

Tradicionalmente, los métodos de compresión, tanto lossy como lossless, dependían de funcionalidades computables basadas en conceptos establecidos hace más de 80 años. Sin embargo, al acercarse el requerimiento de velocidad de comunicación 6G, la capacidad de los modelos para asimilar y procesar datos se vuelve esencial. En este contexto, la capacidad de los LLMs para acercarse a la “inducción de Solomonoff”, una teoría que data de los años 60, ofrece una nueva perspectiva. LMCompress sigue este paradigma reconociendo patrones y estructuras en los datos que anteriormente se consideraban inclasificables.

El proceso consiste en transformar los datos originales en una secuencia de tokens, que luego son procesados por un modelo generativo grande, generando una distribución predictiva. Mediante la codificación aritmética, los datos pueden luego ser comprimidos de forma efectiva. Los experimentos con LMCompress, tanto en compresión de imágenes, videos, audios y textos, han mostrado ratios de compresión varias veces superiores a los métodos convencionales.

A través de este marco innovador, LMCompress multiplicó el ratio de compresión para imágenes del conjunto CLIC2019 y el ISLVRC, alcanzando hasta 6.32 veces su tamaño original en comparación con otras herramientas. Asimismo, en compresión de video, demostró un considerable rendimiento incluso en escenas dinámicas, mejorando los ratios por encima del 50% frente a las alternativas estándar.

En conclusión, LMCompress no solo representa un salto enorme en términos de eficiencia y capacidad de compresión, sino que también allana el camino para el futuro de las telecomunicaciones, especialmente en ámbitos donde el ancho de banda es limitado. A medida que los modelos mejoren su comprensión del contenido a transmitir, surgirán aplicaciones innovadoras capaces de codificar y decodificar de manera mucho más rápida y segura el flujo de información, sentando un precedente para futuras generaciones de comunicaciones.