il y a 6 mois

Résumé

Les systèmes modernes de reconnaissance visuelle sont souvent limités dans leur capacité à s'échelonner à un grand nombre de catégories d'objets. Cette limitation s'explique en partie par la difficulté croissante de collecter des données d'apprentissage suffisantes sous forme d'images étiquetées à mesure que le nombre de catégories d'objets augmente. Une solution consiste à tirer parti de données provenant d'autres sources — telles que des données textuelles — à la fois pour entraîner les modèles visuels et pour contraindre leurs prédictions. Dans cet article, nous présentons un nouveau modèle profond d'encodage visuel et sémantique, entraîné pour identifier les objets visuels à l'aide à la fois de données d'images étiquetées et d'informations sémantiques extraites de textes non annotés. Nous démontrons que ce modèle atteint des performances au niveau de l'état de l'art sur le défi de reconnaissance d'objets ImageNet à 1000 classes, tout en commettant des erreurs plus raisonnables du point de vue sémantique. Nous montrons également que l'information sémantique peut être exploitée pour effectuer des prédictions concernant des dizaines de milliers d'étiquettes d'images non observées durant l'apprentissage. La connaissance sémantique améliore ainsi les prédictions « zero-shot » jusqu'à 65 %, atteignant des taux de succès allant jusqu'à 10 % sur des milliers de nouvelles étiquettes jamais vues par le modèle visuel.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Reconnaissance D'images

Multimodal

Apprentissage Profond

Domaine De Recherche

Multimodal

Vision Par Ordinateur

Tâche

Marc'Aurelio Ranzato Jeff Dean Samy Bengio Jon Shlens Greg S. Corrado Andrea Frome Tomas Mikolov

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Reconnaissance D'images

Multimodal

Apprentissage Profond

Domaine De Recherche

Multimodal

Vision Par Ordinateur

Tâche

Marc'Aurelio Ranzato Jeff Dean Samy Bengio Jon Shlens Greg S. Corrado Andrea Frome Tomas Mikolov

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

DeViSE : un modèle d’intégration visuelle et sémantique profonde

Marc'Aurelio Ranzato Jeff Dean Samy Bengio Jon Shlens Greg S. Corrado Andrea Frome Tomas Mikolov

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DeViSE : un modèle d’intégration visuelle et sémantique profonde

Marc'Aurelio Ranzato Jeff Dean Samy Bengio Jon Shlens Greg S. Corrado Andrea Frome Tomas Mikolov

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DeViSE : un modèle d’intégration visuelle et sémantique profonde

Marc'Aurelio Ranzato Jeff Dean Samy Bengio Jon Shlens Greg S. Corrado Andrea Frome Tomas Mikolov

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters