HyperAIHyperAI
il y a 2 mois

Caractéristiques de canal agrégées pour la détection multivue des visages

Bin Yang; Junjie Yan; Zhen Lei; Stan Z. Li
Caractéristiques de canal agrégées pour la détection multivue des visages
Résumé

La détection de visages a suscité beaucoup d'attention ces dernières décennies depuis le travail pionnier de Viola et Jones. Bien que de nombreuses améliorations aient été apportées grâce à des algorithmes d'apprentissage plus puissants, la représentation des caractéristiques utilisée pour la détection de visages ne répond toujours pas aux exigences pour gérer efficacement et efficacement les visages présentant une grande variabilité d'apparence dans des conditions réelles. Pour résoudre cette problématique, nous avons emprunté le concept de caractéristiques par canaux au domaine de la détection de visages, ce qui étend le canal d'image à divers types tels que l'amplitude du gradient et les histogrammes de gradients orientés, encodant ainsi des informations riches sous une forme simple. Nous avons adopté une nouvelle variante appelée caractéristiques par canaux agrégées, exploré pleinement la conception des caractéristiques, et découvert une version multi-échelle des caractéristiques offrant de meilleures performances. Pour traiter les poses des visages dans des conditions réelles, nous proposons une approche de détection multi-vues mettant en avant le reclassement des scores et l'ajustement de la détection. En suivant les pipelines d'apprentissage du cadre Viola-Jones, le détecteur de visages multi-vues utilisant les caractéristiques par canaux agrégées montre des performances compétitives par rapport aux algorithmes les plus avancés sur les ensembles de tests AFW et FDDB, tout en fonctionnant à 42 images par seconde (FPS) sur des images VGA.

Caractéristiques de canal agrégées pour la détection multivue des visages | Articles de recherche récents | HyperAI