Command Palette
Search for a command to run...
Réseaux denses multi-échelles pour une classification d’images efficace en ressources
Réseaux denses multi-échelles pour une classification d’images efficace en ressources
Résumé
Dans cet article, nous étudions la classification d’images sous contrainte de ressources computationnelles au moment de l’évaluation. Deux cadres particuliers sont envisagés : 1. la classification « à tout moment » (anytime classification), dans laquelle la prédiction du réseau pour un exemple d’évaluation est progressivement affinée, permettant ainsi d’obtenir une sortie prédictive à tout instant ; 2. la classification par lots avec budget fixe (budgeted batch classification), où un volume fixe de calcul est disponible pour classer un ensemble d’exemples, pouvant être réparti de manière inégale entre des entrées « plus faciles » et « plus difficiles ». Contrairement à la plupart des travaux antérieurs, tels que l’algorithme populaire de Viola et Jones, notre approche repose sur des réseaux de neurones convolutifs. Nous entraînons plusieurs classificateurs ayant des exigences computationnelles variables, que nous appliquons de manière adaptative au moment de l’évaluation. Afin de maximiser la réutilisation des calculs entre les différents classificateurs, nous intégrons ces derniers comme sorties anticipées (early-exits) dans un seul réseau de neurones convolutif profond, en les interconnectant via une connectivité dense. Pour favoriser une classification de haute qualité dès les premières étapes, nous utilisons une architecture de réseau à deux dimensions à multiples échelles, qui préserve à la fois les caractéristiques de niveau grossier et de niveau fin tout au long du réseau. Des expériences menées sur trois tâches de classification d’images montrent que notre cadre améliore de manière significative l’état de l’art existant dans les deux situations.