HyperAIHyperAI
il y a 17 jours

Classification visuelle fine par entraînement progressif à plusieurs granularités sur des morceaux de puzzle

Ruoyi Du, Dongliang Chang, Ayan Kumar Bhunia, Jiyang Xie, Zhanyu Ma, Yi-Zhe Song, Jun Guo
Classification visuelle fine par entraînement progressif à plusieurs granularités sur des morceaux de puzzle
Résumé

La classification visuelle fine-grain (FGVC) est bien plus exigeante que les tâches traditionnelles de classification en raison des variations intra-classes intrinsèquement subtiles. Les travaux récents abordent principalement ce défi en se concentrant sur la localisation des parties les plus discriminantes, des parties plus complémentaires, ainsi que des parties à différentes granularités. Toutefois, peu d’efforts ont été consacrés à déterminer quelles granularités sont les plus discriminantes, ni à la fusion efficace des informations à travers différentes granularités. Dans ce travail, nous proposons un cadre novateur pour la classification visuelle fine-grain afin de répondre à ces problèmes. Plus précisément, nous introduisons : (i) une stratégie d’entraînement progressive permettant de fusionner efficacement les caractéristiques issues de différentes granularités, et (ii) un générateur aléatoire de morceaux en puzzle (jigsaw patch) qui incite le réseau à apprendre des caractéristiques à des granularités spécifiques. Nous obtenons des performances de pointe sur plusieurs jeux de données standards de benchmark FGVC, où la méthode proposée dépasse systématiquement les approches existantes ou atteint des résultats compétitifs. Le code sera mis à disposition à l’adresse suivante : https://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Training.