HyperAIHyperAI
il y a 2 mois

Prédiction de centre et d'échelle : Approche sans ancre pour la détection de piétons et de visages

Wei Liu; Irtiza Hasan; Shengcai Liao
Prédiction de centre et d'échelle : Approche sans ancre pour la détection de piétons et de visages
Résumé

La détection d'objets nécessite généralement des classifieurs à fenêtre glissante dans les approches traditionnelles ou des prédictions basées sur des boîtes d'ancre dans les méthodes modernes d'apprentissage profond. Cependant, chacune de ces approches requiert une configuration fastidieuse des boîtes. Dans cet article, nous proposons une nouvelle perspective où la détection d'objets est motivée comme une tâche de détection de caractéristiques sémantiques de haut niveau. De la même manière que les détecteurs d'arêtes, de coins et de blobs, le détecteur proposé balaye l'image entière pour rechercher des points caractéristiques, ce qui convient naturellement aux convolutions. Cependant, contrairement à ces caractéristiques de bas niveau traditionnelles, le détecteur proposé vise une abstraction de plus haut niveau, c'est-à-dire qu'il cherche des points centraux où se trouvent des objets, et les modèles modernes d'apprentissage profond sont déjà capables d'une telle abstraction sémantique de haut niveau. De plus, comme pour la détection de blobs, nous prédisons également les échelles des points centraux, ce qui est également une convolution directe. Ainsi, dans cet article, la détection de piétons et de visages est simplifiée en une tâche directe de prédiction du centre et de l'échelle par convolutions. Cette méthode bénéficie ainsi d'un paramétrage sans boîtes. Bien que sa structure soit simple, elle présente une précision compétitive sur plusieurs benchmarks difficiles, notamment la détection de piétons et la détection de visages. De plus, une évaluation inter-bases a été réalisée, démontrant une capacité généralisatrice supérieure de la méthode proposée. Le code source et les modèles peuvent être consultés à l'adresse suivante : (https://github.com/liuwei16/CSP) et (https://github.com/hasanirtiza/Pedestron).

Prédiction de centre et d'échelle : Approche sans ancre pour la détection de piétons et de visages | Articles de recherche récents | HyperAI