Régression ordonnée consistante en rang pour les réseaux de neurones avec application à l'estimation de l'âge

Dans de nombreuses tâches de prédiction réelles, les étiquettes de classe contiennent des informations sur l'ordre relatif entre les étiquettes, qui ne sont pas capturées par les fonctions de perte couramment utilisées telles que l'entropie croisée multi-catégories. Récemment, la communauté de l'apprentissage profond a adopté des cadres de régression ordinale pour prendre en compte ces informations d'ordre. Les réseaux neuronaux ont été dotés de capacités de régression ordinale en transformant les cibles ordinales en sous-tâches de classification binaire. Cependant, cette méthode souffre d'incohérences entre les différents classifieurs binaires. Pour résoudre ces incohérences, nous proposons le cadre COnsistent RAnk Logits (CORAL), qui offre des garanties théoriques solides pour la monotonie du rang et des scores de confiance cohérents. De plus, la méthode proposée est indépendante de l'architecture et peut être appliquée à des classifieurs neuronaux profonds d'avant-garde arbitraires pour des tâches de régression ordinale. L'évaluation empirique de la méthode proposée, basée sur la cohérence du rang, sur une variété de jeux de données d'images faciales pour la prédiction de l'âge montre une réduction substantielle de l'erreur de prédiction par rapport au réseau ordinal standard utilisé comme référence.