Con el auge de la inteligencia artificial y los modelos de aprendizaje profundo, el campo de la evaluación automática del dolor ha experimentado una transformación notable. Una de las innovaciones más destacadas es PainFormer, un modelo fundacional basado en visión que automatiza el proceso de evaluación del dolor, proporcionando representaciones de alta calidad a partir de diversas modalidades de entrada, tanto visuales como fisiológicas.
Para probar la eficacia de PainFormer, se realizaron experimentaciones extensas utilizando dos conjuntos de datos principales: BioVid y AI4Pain. Estos conjuntos incluyen modalidades de video en RGB y estimaciones sintéticas de profundidad y thermal, además de datos fisiológicos como señales ECG, EMG, GSR y fNIRS, todos ellos transformados en representaciones visuales tanto en forma de ondas como de espectrograma.
El análisis reveló que las modalidades de video en RGB ofrecieron un excelente rendimiento, alcanzando una precisión del 76,29% en el conjunto de BioVid. Sin embargo, al fusionar las modalidades de video, se observó una mejora sutil en el rendimiento, mostrando que la combinación de videos RGB, térmicos y de profundidad provee una representación rica y robusta para estimar el dolor.
En cuanto a los datos fisiológicos, el ECG mostró un desempeño sólido, destacándose la representación del espectrograma PSD, superando a otras visualizaciones con un 75,49% de precisión. Mientras que en las señales EMG, los modelos lograron también un rendimiento notable al combinar representaciones de forma de onda y espectrograma.
El GSR, reconocido como una modalidad fisiológica eficaz para evaluar el dolor, alcanzó la mayor precisión entre las modalidades individuales con un 88,99%. Esto indica que las señales fisiológicas en forma de onda proporcionan evidencia crítica para la detección del dolor.
Finalmente, la fusión de señales fisiológicas y modalidades de video automatizó la evaluación del dolor, alcanzando el más alto rendimiento registrado de 89,08% al combinar las representaciones de las modalidades de video con las señales GSR.
Los resultados demostraron que el modelo PainFormer no solo es capaz de mejorar la precisión en la evaluación automática del dolor, sino que también es una herramienta escalable que ofrece adaptaciones versátiles para diferentes modalidades de entrada. Las áreas de atención del modelo revelaron un enfoque sensible en aspectos significativos de las imágenes de RGB, temperatura y profundidad, sugiriendo que este modelo está bien posicionado para ayudar en la evaluación clínica y el manejo del dolor con una comprensión más holística y precisa.