HyperAIHyperAI

Command Palette

Search for a command to run...

CMS-RCNN : CNN basée sur des régions multi-échelles et contextuelles pour la détection de visages non contrainte

Chenchen Zhu* Student, IEEE Yutong Zheng* Student, IEEE Khoa Luu Member, IEEE Marios Savvides Senior Member, IEEE

Résumé

La détection robuste de visages dans des conditions réelles est l'un des composants ultimes pour soutenir divers problèmes liés aux visages, tels que la reconnaissance faciale non contrainte, la reconnaissance périoculaire faciale, le repérage de points d'intérêt faciaux et l'estimation de pose, la reconnaissance d'expressions faciales, la construction de modèles 3D du visage, etc. Bien que le problème de détection de visages ait été intensément étudié pendant des décennies avec diverses applications commerciales, il rencontre encore des difficultés dans certaines situations réelles en raison de nombreux défis, par exemple des occultations faciales importantes, des résolutions extrêmement basses, une éclairage intense, des variations de pose exceptionnelles, des artefacts dus à la compression d'images ou de vidéos, etc.Dans cet article, nous présentons une approche de détection de visages nommée Contextual Multi-Scale Region-based Convolutional Neural Network (CMS-RCNN) pour résoudre efficacement les problèmes mentionnés ci-dessus. De manière similaire aux CNNs basés sur des régions, notre réseau proposé comprend un composant de proposition de régions et un composant de détection des régions d'intérêt (RoI). Cependant, au-delà de cette structure réseau, notre approche présente deux contributions principales qui jouent un rôle significatif pour atteindre les performances les plus avancées en matière de détection de visages. Premièrement, les informations multi-échelles sont regroupées tant dans la proposition de régions que dans la détection des RoI pour traiter les petites zones faciales. Deuxièmement, notre réseau permet une inférence contextuelle explicite du corps inspirée par l'intuition du système visuel humain.L'approche proposée a été évaluée sur deux bases de données récentes et difficiles en détection de visages : le WIDER FACE Dataset qui contient un haut niveau de variabilité et le Face Detection Dataset and Benchmark (FDDB). Les résultats expérimentaux montrent que notre approche formée sur le WIDER FACE Dataset surpassent largement les lignes directrices solides sur ce même dataset et obtient constamment des résultats compétitifs sur FDDB par rapport aux méthodes les plus récentes et avancées en détection de visages.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp