LSTD : Un détecteur de transfert à faible tirage pour la détection d'objets

Les progrès récents en détection d'objets sont principalement guidés par l'apprentissage profond avec des benchmarks de détection à grande échelle. Cependant, l'ensemble d'entraînement entièrement annoté est souvent limité pour une tâche de détection ciblée, ce qui peut détériorer les performances des détecteurs profonds. Pour relever ce défi, nous proposons dans cet article un nouveau détecteur de transfert à faible nombre de tirages (LSTD), où nous exploitons une connaissance riche du domaine source pour construire un détecteur efficace du domaine cible avec très peu d'exemples d'entraînement. Les principales contributions sont décrites comme suit.Premièrement, nous concevons une architecture profonde flexible de LSTD afin d'atténuer les difficultés de transfert en détection à faible nombre de tirages. Cette architecture peut intégrer les avantages tant de SSD que de Faster R-CNN au sein d'un cadre profond unifié. Deuxièmement, nous introduisons un nouveau cadre d'apprentissage par transfert régularisé pour la détection à faible nombre de tirages, où les régularisations par connaissance de transfert (TK) et par atténuation du fond (BD) sont proposées pour exploiter respectivement la connaissance des objets des domaines source et cible, afin d'améliorer davantage le fine-tuning avec quelques images cibles. Enfin, nous évaluons notre LSTD sur plusieurs expériences de détection à faible nombre de tirages difficiles, où LSTD surpassent les autres approches de pointe. Les résultats montrent que LSTD est un détecteur profond préférable pour les scénarios à faible nombre de tirages.