En un esfuerzo por mejorar la Adaptación de Interfaces de Usuario (UI), se ha desarrollado un marco integrado de aprendizaje por refuerzo que incorpora retroalimentación humana para perfeccionar las experiencias de usuario. Este enfoque reconoce la deficiencia de las estrategias de adaptación actuales que suelen basarse en modelos predefinidos, carentes de capacidad de respuesta en tiempo real, y apunta a crear agentes de aprendizaje por refuerzo (RL) personalizados para cada usuario, optimizando las adaptaciones de UI de forma más individualista y receptiva.
Esta novedosa metodología fue puesta a prueba mediante un estudio empírico con 33 participantes que interactuaron con Interfaces de Usuario Adaptativas (AUI) en dos dominios: una plataforma de aprendizaje en línea y una aplicación de planificación de viajes. La investigación reveló resultados alentadores, destacando que la integración de la retroalimentación humana en el proceso de aprendizaje de RL no solo mejora significativamente la Experiencia de Usuario (UX), sino que también ofrece pistas prometedoras para desarrollar capacidades adaptativas más avanzadas y un diseño centrado en el usuario.
El estudio evidenció que al permitir a los usuarios contribuir activamente en la configuración de sus agentes de RL personales se logran adaptaciones de UI más personalizadas. Estos agentes adaptan sus políticas basado en experiencias de interacciones previas, maximizando las recompensas acumulativas que reflejan la satisfacción general del usuario, y permiten ajustar los elementos de la interfaz correctamente de acuerdo a las necesidades individuales en escenarios de adaptación compleja.
En contraposición a estudios previos que dependían de reglas predefinidas o modelos fuera de línea, los resultados aquí obtenidos indican que integrar directamente la retroalimentación del usuario en la señal de recompensa mejora notablemente la alineación de la interfaz adaptativa con las preferencias del usuario. Además, se resalta que, dentro del marco de aprendizaje, el diseño eficaz de funciones de recompensa es crucial, ya que una función diseñada inadecuadamente podría conducir a comportamientos subóptimos del agente.
El estudio concluye que la personalización y la recolección de retroalimentación humana en tiempo real son pasos necesarios para lograr una adaptabilidad más profunda y específica en las adaptaciones de UI, conforme al individualismo de los usuarios y la variabilidad de sus requerimientos contextuales. Esto establece un precedente alentador para el despliegue de interfaces más ajustadas a las expectativas y necesidades de los usuarios en aplicaciones de software, conduciendo así a niveles de satisfacción sin precedentes.