Un nuevo marco para el descubrimiento continuo de categorías en IA

En el mundo de la inteligencia artificial, el descubrimiento continuo de categorías es un hito crucial para la evolución de los modelos en entornos dinámicos. El descubrimiento continuo generalizado de categorías (C-GCD) presenta un desafío único: aprender nuevas clases de datos no etiquetados sin olvidar las clases ya conocidas. Investigadores del Instituto de Automatización de la Academia China de Ciencias han propuesto un marco de aprendizaje sesgado llamado “Happy” que promete gestionar esta tarea con gran eficacia.

El proceso comienza con el entrenamiento del modelo utilizando datos etiquetados de clases conocidas, lo que proporciona un conocimiento básico. En las siguientes etapas, el modelo se enfrenta al reto de identificar clases nuevas sin datos de ejemplo de las clases anteriores debido a preocupaciones de privacidad y almacenamiento. Este enfoque pragmático se diferencia del método tradicional reuniendo más clases nuevas a lo largo de más etapas de manera incremental.

Una de las principales dificultades que enfrenta el modelo es lidiar con dos objetivos conflictivos: descubrir nuevas clases y evitar olvidar las antiguas. Los investigadores han identificado que los modelos pueden ser susceptibles a dos tipos de sesgos: el de predicción y el de dureza. Estos se manifiestan cuando el sistema muestra una sobreconfianza en las clases antiguas y un olvido catastrófico de estas últimas al aprender nuevas.

Para abordar estos desafíos, el equipo presentó un enfoque denominado “muestreo de prototipos consciente de la dureza” y una regularización de entropía suave. Esto último ayuda a asignar probabilidades adecuadas a las clases nuevas, lo cual es esencial para mejorar el rendimiento de agrupamiento de las clases recién introducidas. El muestreo de prototipos, por su parte, mitiga el olvido catastrófico mediante el uso de muestras de características sintetizadas de las clases antiguas.

Los resultados experimentales han demostrado que “Happy” gestiona eficazmente el conflicto inherente al C-GCD y alcanza un rendimiento notable en diferentes conjuntos de datos, mostrando una mejora del 7,5% en ImageNet-100. Esto subraya la capacidad del enfoque para descubrir nuevas categorías de manera efectiva y, al mismo tiempo, mitigar el olvido de las antiguas.

La implementación del modelo, que está disponible públicamente, pone de relieve la eficacia del aprendizaje sesgado al proporcionar una base sólida para la adaptación de modelos en entornos dinámicos. “Happy” no solo logra descubrir nuevas clases con un mínimo de olvido, sino que también ofrece pistas sobre las mejoras necesarias en los sistemas de IA para que sean más semejantes a los procesos de aprendizaje humano, donde la adquisición de nuevos conocimientos es esencial sin borrar los adquiridos anteriormente.

Solo noticias

y ya

Un nuevo marco para el descubrimiento continuo de categorías en IA