Pondération transdimensionnelle pour les caractéristiques convolutives profondes agrégées

Nous proposons une méthode simple et directe pour créer des représentations d'images puissantes grâce au pondération et à l'agrégation inter-dimensionnelles des sorties de couches de réseaux neuronaux convolutifs profonds. Nous présentons d'abord un cadre généralisé qui englobe une large famille d'approches et inclut des étapes de pondération et de pooling inter-dimensionnels. Nous proposons ensuite des schémas non paramétriques spécifiques pour la pondération spatiale et canal par canal, qui amplifient l'effet des réponses spatiales très actives tout en régulant les effets de sursaturation. Nous menons des expériences sur différents jeux de données publics pour la recherche d'images et montrons que notre approche surpasses l'état de l'art actuel pour les méthodes basées sur des réseaux pré-entraînés. Nous fournissons également une implémentation open source facile à utiliser, qui reproduit nos résultats.