Innovadores avances en conducción autónoma con el modelo DiffVLA

En un innovador avance en la conducción autónoma, el equipo RB ha presentado el marco DiffVLA, una sofisticada combinación de técnicas de visión y lenguaje aplicadas a la planificación de trayectorias en vehículos autónomos. La novedad radica en la integración de un modelo híbrido de percepción que combina enfoques de percepción densa y dispersa, facilitando un cálculo más eficiente y preciso de las rutas a seguir en entornos complejos.

La metodología empleada permite capturar tanto las características explícitas como implícitas del entorno vial. Por un lado, la rama de percepción densa proporciona un mapa de características detallado desde una vista de pájaro a partir de imágenes obtenidas de múltiples cámaras, esenciales para comprender el espacio navegable. Por otro lado, la rama de percepción dispersa se centra en la detección a nivel de instancia de obstáculos clave y elementos del mapa, elementos fundamentales para evitar colisiones.

Una de las aportaciones más notables del DiffVLA es su módulo de orientación, que utiliza modelos de lenguaje y visión (VLM) para generar comandos de conducción de alto nivel a partir de diversas vistas de cámara. Estos modelos integran instrucciones externas de navegación, mejorando la capacidad de adaptación del sistema a situaciones de tráfico dinámico y entornos sintéticos altamente realistas, como los presentados en la competición Autonomous Grand Challenge 2025.

En cuanto al procesamiento difuso, la inclusión de una política de planificación de trayectorias basada en anclajes multimodales muestra una mejora considerable en el rendimiento, reduciendo significativamente la tasa de colisión en condiciones de alta velocidad. Además, un enfoque jerárquico para codificar la información ha demostrado ser eficaz al incrementar la comprensión del entorno y optimizar la selección de trayectorias.

El entorno de evaluación NAVSIM2 ha permitido demostrar que la arquitectura del VLA logra métricas sobresalientes, como un puntaje EPDMS de 45.0 en situaciones de tráfico reactivo y simulaciones de alta fidelidad. Los experimentos han confirmado también la eficiencia del enfoque híbrido en el cumplimiento de normas de tránsito como el mantenimiento de carril y la obediencia a las luces de tráfico.

El sistema DiffVLA marca un paso importante en el camino a una conducción autónoma más segura y precisa, integrando técnicas avanzadas de aprendizaje y procesamiento de datos para abordar desafíos complejos en tiempo real. En este sentido, la combinación de percepción dispersa y densa junto con las guías de VLM ofrece una potente herramienta que podría redefinir las capacidades de los vehículos autónomos del futuro.

Solo noticias

y ya

Innovadores avances en conducción autónoma con el modelo DiffVLA