HyperAIHyperAI
il y a 11 jours

Distillation améliorée des connaissances pour le décompte de foule sur un dispositif IoT

{Richard O. Sinnott, Zuo Huang}
Résumé

Le comptage manuel des foules dans des problèmes du monde réel est soit impossible, soit conduit à des estimations extrêmement imprécises. L'apprentissage profond constitue une des approches exploitées pour résoudre ce défi. Le comptage de foules est une tâche très intensive sur le plan computationnel. Ainsi, de nombreux modèles de comptage de foules s'appuient sur des réseaux de neurones convolutifs profonds à grande échelle (CNN) afin d'atteindre une précision accrue. Toutefois, ces modèles sont généralement associés à une perte de performance et à une lenteur de déduction (inference speed), ce qui limite leur application dans des environnements réels, par exemple sur des dispositifs Internet des objets (IoT). Pour pallier ce problème, une solution consiste à compresser les modèles par élagage (pruning) et quantification, ou à utiliser des architectures de modèles légers (lightweight backbones). Toutefois, ces méthodes entraînent souvent une perte significative de précision. Afin de remédier à ce défaut, certaines études ont exploré des méthodes de distillation de connaissances visant à extraire des informations utiles à partir de modèles grands et performants (modèles « enseignants ») afin de guider ou d’entraîner des modèles plus petits (modèles « élèves »). Toutefois, les méthodes de distillation de connaissances souffrent d’un problème de perte d’information causée par les transformateurs d’indices (hint-transformers). En outre, les modèles enseignants peuvent avoir un effet négatif sur les modèles élèves. Dans ce travail, nous proposons une méthode fondée sur la distillation de connaissances qui utilise des indices auto-transformés et des fonctions de perte ignorant les valeurs aberrantes (outliers), afin de relever les défis posés par le comptage de foules dans des scénarios réels complexes. Grâce à notre approche, nous atteignons un MAE de 77,24 et un MSE de 276,17 sur le jeu de test JHU-CROWD++ [1]. Ces résultats sont comparables à ceux des modèles les plus avancés en comptage de foules profondes, tout en réduisant considérablement la taille et la complexité initiales du modèle, rendant ainsi la solution adaptée aux dispositifs IoT. Le code source est disponible à l’adresse suivante : https://github.com/huangzuo/effcc_distilled.

Distillation améliorée des connaissances pour le décompte de foule sur un dispositif IoT | Articles de recherche récents | HyperAI