Solo noticias

y ya

lunes 14 de de 2024

Revolucionando el Seguimiento de Objetos en Video con 'VOVTrack'

La investigación realizada por Zekun Qian y Wei Feng, entre otros, propone un nuevo método denominado “VOVTrack” para optimizar el proceso de seguimiento de objetos con vocabulario abierto en vídeos. Este enfoque aborda de manera más efectiva la tarea de localizar y seguir objetos, tanto de categorías conocidas como de novedosas, en secuencias de video.

El nuevo método integra los estados de los objetos relevantes para el seguimiento durante el entrenamiento centrado en vídeo. A diferencia de propuestas anteriores que separan la detección y el seguimiento en módulos independientes, “VOVTrack” sobrepasa estas limitaciones al introducir un mecanismo de atención guiada por prompts que mejora la localización y clasificación de objetos que cambian con el tiempo. Además, emplea datos de video sin anotaciones para entrenar a través de técnicas de aprendizaje autosupervisado de similitud de objetos.

Los resultados experimentales han demostrado que “VOVTrack” supera a los métodos existentes, estableciéndose como una solución de vanguardia para la tarea de seguimiento de objetos abierto. Esto es particularmente relevante en aplicaciones reales, donde la variedad de categorías de objetos es esencial. Diversos conjuntos de datos y algoritmos anteriores se han centrado principalmente en pocos tipos de objetos, como humanos y vehículos, pero este nuevo enfoque aborda una gama más amplia de categorías.

Una clara ventaja que sitúa al “VOVTrack” por encima de otros métodos, como el propuesto por Li et al. en 2023, es su capacidad para emplear todo el video sin anotar para el entrenamiento, lo que reduce significativamente la carga de anotaciones para el seguimiento de objetos. Mediante la formulación del problema de asociación temporal como un problema de optimización, el sistema asegura la consistencia del objeto a través de diferentes cuadros, maximizando así la eficacia en el seguimiento de objetos en tiempo real.

En conclusión, “VOVTrack” presenta un avance relevante en el seguimiento de objetos de vocabulario abierto, permitiendo no sólo una mejora en la precisión, sino también una optimización del proceso mediante técnicas autosupervisadas que explotan la información secuencial de los vídeos.