HyperAIHyperAI
il y a 16 jours

DIRV : Vote régional d'interaction dense pour la détection d'interactions homme-objet en bout-en-bout

Hao-Shu Fang, Yichen Xie, Dian Shao, Cewu Lu
DIRV : Vote régional d'interaction dense pour la détection d'interactions homme-objet en bout-en-bout
Résumé

Ces dernières années, la détection d'interactions homme-objet (HOI) a connu des progrès remarquables. Toutefois, les méthodes classiques à deux étapes sont généralement lentes en phase d'inférence. D'autre part, les méthodes à une seule étape existantes se concentrent principalement sur les régions unies des interactions, ce qui introduit des informations visuelles superflues pouvant perturber la détection HOI. Pour résoudre ces problèmes, nous proposons dans cet article une nouvelle approche unidirectionnelle de détection HOI, appelée DIRV, fondée sur un nouveau concept : la région d'interaction, spécifique au problème HOI. Contrairement aux méthodes précédentes, notre approche se concentre sur des régions d'interaction densément échantillonnées à différentes échelles pour chaque paire homme-objet, afin de capturer les caractéristiques visuelles subtiles les plus essentielles à l'interaction. En outre, afin de compenser les lacunes de détection liées à une seule région d'interaction, nous introduisons une nouvelle stratégie de vote qui exploite pleinement les régions d'interaction chevauchantes, à la place de la suppression non maximale classique (NMS). Des expériences étendues sur deux benchmarks populaires, V-COCO et HICO-DET, montrent que notre méthode surpasser largement les états de l'art existants, tant en termes de précision que de vitesse d'inférence, tout en reposant sur une architecture réseau la plus légère. Nous atteignons un score de 56,1 mAP sur V-COCO sans nécessiter d'entrée supplémentaire. Le code source est disponible publiquement à l'adresse suivante : https://github.com/MVIG-SJTU/DIRV

DIRV : Vote régional d'interaction dense pour la détection d'interactions homme-objet en bout-en-bout | Articles de recherche récents | HyperAI