HyperAIHyperAI

Command Palette

Search for a command to run...

Base de référence simple pour le réponse aux questions visuelles

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Résumé

Nous décrivons une ligne de base très simple basée sur un sac de mots (bag-of-words) pour la réponse à des questions visuelles. Cette ligne de base concatène les caractéristiques lexicales issues de la question et les caractéristiques CNN issues de l'image afin de prédire la réponse. Lorsqu'elle est évaluée sur le jeu de données VQA [2], elle montre des performances comparables à celles de nombreuses approches récentes utilisant des réseaux neuronaux récurrents. Pour explorer les points forts et les faiblesses du modèle entraîné, nous fournissons également une démonstration interactive en ligne et du code source open-source.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp