HyperAIHyperAI

Command Palette

Search for a command to run...

Prédiction de centre et d'échelle : Approche sans ancre pour la détection de piétons et de visages

Wei Liu extsuperscript1* Irtiza Hasan extsuperscript2* Shengcai Liao extsuperscript2**

Résumé

La détection d'objets nécessite généralement des classifieurs à fenêtre glissante dans les approches traditionnelles ou des prédictions basées sur des boîtes d'ancre dans les méthodes modernes d'apprentissage profond. Cependant, chacune de ces approches requiert une configuration fastidieuse des boîtes. Dans cet article, nous proposons une nouvelle perspective où la détection d'objets est motivée comme une tâche de détection de caractéristiques sémantiques de haut niveau. De la même manière que les détecteurs d'arêtes, de coins et de blobs, le détecteur proposé balaye l'image entière pour rechercher des points caractéristiques, ce qui convient naturellement aux convolutions. Cependant, contrairement à ces caractéristiques de bas niveau traditionnelles, le détecteur proposé vise une abstraction de plus haut niveau, c'est-à-dire qu'il cherche des points centraux où se trouvent des objets, et les modèles modernes d'apprentissage profond sont déjà capables d'une telle abstraction sémantique de haut niveau. De plus, comme pour la détection de blobs, nous prédisons également les échelles des points centraux, ce qui est également une convolution directe. Ainsi, dans cet article, la détection de piétons et de visages est simplifiée en une tâche directe de prédiction du centre et de l'échelle par convolutions. Cette méthode bénéficie ainsi d'un paramétrage sans boîtes. Bien que sa structure soit simple, elle présente une précision compétitive sur plusieurs benchmarks difficiles, notamment la détection de piétons et la détection de visages. De plus, une évaluation inter-bases a été réalisée, démontrant une capacité généralisatrice supérieure de la méthode proposée. Le code source et les modèles peuvent être consultés à l'adresse suivante : (https://github.com/liuwei16/CSP) et (https://github.com/hasanirtiza/Pedestron).


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Prédiction de centre et d'échelle : Approche sans ancre pour la détection de piétons et de visages | Articles | HyperAI