HyperAIHyperAI

Command Palette

Search for a command to run...

Estimation du bruit par estimation de densité pour l'apprentissage multimodal auto-supervisé

Elad Amrani Rami Ben-Ari Daniel Rotman Alex Bronstein

Résumé

L’un des facteurs clés permettant aux modèles d’apprentissage automatique de comprendre et de résoudre des tâches du monde réel réside dans l’exploitation de données multimodales. Malheureusement, l’étiquetage de ces données multimodales est complexe et coûteux. Récemment, des méthodes d’apprentissage automatique auto-supervisé combinant vision et langage ont été proposées afin d’apprendre des représentations multimodales sans nécessiter d’étiquetage. Toutefois, ces approches négligent souvent la présence d’un niveau élevé de bruit, ce qui conduit à des résultats sous-optimaux. Dans ce travail, nous montrons que le problème d’estimation du bruit dans les données multimodales peut être réduit à une tâche d’estimation de densité multimodale. En exploitant l’estimation de densité multimodale, nous proposons un bloc de construction pour l’estimation du bruit dans l’apprentissage de représentations multimodales, fondé strictement sur les corrélations intrinsèques entre les différentes modalités. Nous démontrons comment notre estimation du bruit peut être intégrée de manière générale et atteint des performances comparables aux meilleures méthodes actuelles sur cinq jeux de données de référence différents, pour deux tâches multimodales exigeantes : la réponse à des questions vidéo (Video Question Answering) et la recherche vidéo à partir de texte (Text-To-Video Retrieval). En outre, nous fournissons une borne d’erreur probabiliste théorique qui soutient nos résultats empiriques, ainsi qu’une analyse des cas d’échec. Code : https://github.com/elad-amrani/ssml.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp