il y a 7 mois

Résumé

Les récentes avancées dans la modélisation du langage et de la vision ont été appliquées avec succès à la réponse aux questions sur les images. Il est à la fois crucial et naturel d'étendre cette orientation de recherche au domaine vidéo pour la réponse aux questions sur les vidéos (VideoQA). Comparé au domaine des images, où existent des jeux de données de référence annotés à grande échelle, les jeux de données VideoQA sont limités à une petite échelle et sont généralement générés automatiquement. Ces limitations restreignent leur applicabilité en pratique. Nous présentons ici ActivityNet-QA, un jeu de données VideoQA à grande échelle et entièrement annoté. Ce jeu de données comprend 58 000 paires question-réponse sur 5 800 vidéos complexes issues du populaire ensemble de données ActivityNet. Nous fournissons une analyse statistique détaillée de notre jeu de données ActivityNet-QA et menons des expériences approfondies en le comparant avec les méthodes de base existantes pour VideoQA. De plus, nous explorons diverses stratégies de représentation vidéo afin d'améliorer les performances en VideoQA, notamment pour les vidéos longues. Le jeu de données est disponible à l'adresse suivante : https://github.com/MILVLG/activitynet-qa

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Réponse À Des Questions Visuelles

Traitement Vidéo

Multimodal

Vision Par Ordinateur

Tâche

Zhou Yu; Dejing Xu; Jun Yu; Ting Yu; Zhou Zhao; Yueting Zhuang; Dacheng Tao

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Réponse À Des Questions Visuelles

Traitement Vidéo

Multimodal

Vision Par Ordinateur

Tâche

Zhou Yu; Dejing Xu; Jun Yu; Ting Yu; Zhou Zhao; Yueting Zhuang; Dacheng Tao

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

ActivityNet-QA : Un jeu de données pour comprendre les vidéos web complexes par le biais du questionnement et de la réponse | Articles | HyperAI

Command Palette

ActivityNet-QA : Un jeu de données pour comprendre les vidéos web complexes par le biais du questionnement et de la réponse

Zhou Yu; Dejing Xu; Jun Yu; Ting Yu; Zhou Zhao; Yueting Zhuang; Dacheng Tao

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

ActivityNet-QA : Un jeu de données pour comprendre les vidéos web complexes par le biais du questionnement et de la réponse

Zhou Yu; Dejing Xu; Jun Yu; Ting Yu; Zhou Zhao; Yueting Zhuang; Dacheng Tao

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

ActivityNet-QA : Un jeu de données pour comprendre les vidéos web complexes par le biais du questionnement et de la réponse

Zhou Yu; Dejing Xu; Jun Yu; Ting Yu; Zhou Zhao; Yueting Zhuang; Dacheng Tao

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters