il y a 7 mois

Résumé

Ce document traite de la tâche de détection et de reconnaissance des interactions humain-objet (HOI) dans les images et les vidéos. Nous présentons le Graph Parsing Neural Network (GPNN), un cadre qui intègre des connaissances structurales tout en étant différentiable de bout en bout. Pour une scène donnée, le GPNN infère un graphe d'analyse qui comprend i) la structure du graphe HOI représentée par une matrice d'adjacence, et ii) les étiquettes des nœuds. Dans un cadre d'inférence par passage de messages, le GPNN calcule itérativement les matrices d'adjacence et les étiquettes des nœuds. Nous évaluons notre modèle de manière exhaustive sur trois benchmarks de détection HOI pour les images et les vidéos : les jeux de données HICO-DET, V-COCO et CAD-120. Notre approche surpasse significativement les méthodes actuelles, confirmant que le GPNN est évolutif pour de grands jeux de données et s'applique aux paramètres spatio-temporels. Le code est disponible à l'adresse suivante : https://github.com/SiyuanQi/gpnn.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Détection D'objets

Compréhension Vidéo

Vision Par Ordinateur

Tâche

Siyuan Qi∗1,2 Wenguan Wang∗1,3 Baoxiong Jia1,4 Jianbing Shen†3,5 Song-Chun Zhu1,2

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Détection D'objets

Compréhension Vidéo

Vision Par Ordinateur

Tâche

Siyuan Qi∗1,2 Wenguan Wang∗1,3 Baoxiong Jia1,4 Jianbing Shen†3,5 Song-Chun Zhu1,2

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Apprentissage des interactions humain-objet par des réseaux de neurones d'analyse graphique

Siyuan Qi∗1,2 Wenguan Wang∗1,3 Baoxiong Jia1,4 Jianbing Shen†3,5 Song-Chun Zhu1,2

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprentissage des interactions humain-objet par des réseaux de neurones d'analyse graphique

Siyuan Qi∗1,2 Wenguan Wang∗1,3 Baoxiong Jia1,4 Jianbing Shen†3,5 Song-Chun Zhu1,2

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprentissage des interactions humain-objet par des réseaux de neurones d'analyse graphique

Siyuan Qi∗1,2 Wenguan Wang∗1,3 Baoxiong Jia1,4 Jianbing Shen†3,5 Song-Chun Zhu1,2

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters