HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage de Correspondance Bruyante avec Correction de Similarité Métadonnées

Haochen Han Kaiyao Miao Qinghua Zheng Minnan Luo

Résumé

Bien que l'apprentissage multimodal ait connu un succès dans les tâches de recherche intermodale, ce progrès remarquable repose sur la correspondance correcte entre les données multimédia. Cependant, la collecte de telles données idéales est coûteuse et chronophage. En pratique, la plupart des jeux de données largement utilisés sont extraits d'Internet et contiennent inévitablement des paires mal assorties. L'entraînement sur ces jeux de données avec une correspondance bruyante entraîne une dégradation des performances car les méthodes de recherche intermodale peuvent faussement forcer les données mal assorties à être similaires. Pour résoudre ce problème, nous proposons un Réseau de Correction de Similarité Métadonnées (Meta Similarity Correction Network, MSCN) qui fournit des scores de similarité fiables. Nous considérons une tâche de classification binaire comme un processus métadonné qui incite le MSCN à apprendre la discrimination à partir des métadonnées positives et négatives. Afin d'atténuer davantage l'influence du bruit, nous avons conçu une stratégie efficace de purification des données en utilisant les métadonnées comme connaissances a priori pour éliminer les échantillons bruyants. De nombreuses expériences ont été menées pour démontrer les forces de notre méthode face aux bruits synthétiques et réels, y compris sur les ensembles de données Flickr30K, MS-COCO et Conceptual Captions.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp