il y a 7 mois

Résumé

Nous décrivons une ligne de base très simple basée sur un sac de mots (bag-of-words) pour la réponse à des questions visuelles. Cette ligne de base concatène les caractéristiques lexicales issues de la question et les caractéristiques CNN issues de l'image afin de prédire la réponse. Lorsqu'elle est évaluée sur le jeu de données VQA [2], elle montre des performances comparables à celles de nombreuses approches récentes utilisant des réseaux neuronaux récurrents. Pour explorer les points forts et les faiblesses du modèle entraîné, nous fournissons également une démonstration interactive en ligne et du code source open-source.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Réponse À Des Questions Visuelles

Multimodal

Réseau De Neurones Convolutif

Approche/Framework

Multimodal

Tâche

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Base de référence simple pour le réponse aux questions visuelles | Articles | HyperAI

Command Palette

Base de référence simple pour le réponse aux questions visuelles

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Base de référence simple pour le réponse aux questions visuelles

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Base de référence simple pour le réponse aux questions visuelles

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters