Tema: Visión-Lenguaje

2025

Innovadores avances en conducción autónoma con el modelo DiffVLA

jun. 3

El marco DiffVLA integra visión y lenguaje para mejorar la planificación autónoma en entornos complejos

2025

Innovador modelo AI transforma texto en tomografías 3D

jun. 3

Nueva tecnología genera imágenes médicas tridimensionales a partir de texto, superando retos previos y abriendo camino a nuevas aplicaciones clínicas.

2025

Interleave-VLA: Revolución en la Robótica Interactiva

may. 6

Interleave-VLA transforma la comunicación entre humanos y robots con un enfoque innovador de instrucciones intercaladas imagen-texto.

2025

Presentan LightEMMA: Innovador modelo para conducción autónoma

may. 2

LightEMMA destaca por integrar modelos avanzados de visión y lenguaje en vehículos autónomos, pero muestra que queda trabajo por hacer en interpretación y seguridad.

2025

Estereotipos Animales: Un Desafío en la Generación Visual por IA

abr. 30

El algoritmo DALL-E revela sesgos culturales en la creación automatizada de imágenes, poniendo en evidencia estereotipos animalísticos persistentes en la inteligencia artificial.

2025

Step1X-Edit: Innovando la Edición de Imágenes con Tecnología Abierta

abr. 29

Un competitivo modelo de código abierto que desafía a los sistemas propietarios en la edición basada en instrucciones.

2024

Reduciendo Alucinaciones en Modelos Visión-Lenguaje

oct. 22

Un nuevo método mejora la estabilidad y precisión de los modelos multimodales

2024

BoostAdapter prepara el camino para una IA más adaptable y robusta

oct. 22

Un nuevo marco optimiza la adaptación en tiempo de prueba de modelos de visión y lenguaje

2024

Innovación en Optimización de Prompts para Modelos de Visión-Lenguaje

oct. 22

Nuevo enfoque IPO mejora precisión y comprensión de prompts en aplicaciones IA

2024

TCA: Un salto en la Adaptación de Modelos Visuales a Tiempo de Prueba

oct. 22

Un enfoque sin entrenamiento redefine el marco de adaptación de sistemas de visión-lenguaje, mejorando drásticamente la eficiencia y precisión.

2024

VLM2Vec: Innovando los Embebimientos Multimodales

oct. 14

Un nuevo modelo genera avances significativos en tareas que integran texto e imágenes usando MMEB

Solo noticias

y ya

Tema: Visión-Lenguaje

2025

Innovadores avances en conducción autónoma con el modelo DiffVLA

2025

Innovador modelo AI transforma texto en tomografías 3D

2025

Interleave-VLA: Revolución en la Robótica Interactiva

2025

Presentan LightEMMA: Innovador modelo para conducción autónoma

2025

Estereotipos Animales: Un Desafío en la Generación Visual por IA

2025

Step1X-Edit: Innovando la Edición de Imágenes con Tecnología Abierta

2024

Reduciendo Alucinaciones en Modelos Visión-Lenguaje

2024

BoostAdapter prepara el camino para una IA más adaptable y robusta

2024

Innovación en Optimización de Prompts para Modelos de Visión-Lenguaje

2024

TCA: Un salto en la Adaptación de Modelos Visuales a Tiempo de Prueba

2024

VLM2Vec: Innovando los Embebimientos Multimodales