il y a 8 mois

Résumé

L'exploitation de l'information à travers des modalités diverses est connue pour améliorer les performances sur les tâches de segmentation multimodale. Cependant, la fusion efficace de l'information provenant de différentes modalités reste un défi en raison des caractéristiques uniques de chaque modality. Dans cet article, nous proposons une nouvelle stratégie de fusion capable de combiner efficacement l'information provenant de différentes combinaisons de modalités. Nous présentons également un nouveau modèle nommé Multi-Modal Segmentation TransFormer (MMSFormer), qui intègre cette stratégie de fusion pour effectuer des tâches de segmentation matérielle et sémantique multimodale. Le MMSFormer surpasse les modèles actuels les plus avancés sur trois jeux de données différents. En commençant avec une seule modalité d'entrée, les performances s'améliorent progressivement lorsque des modalités supplémentaires sont intégrées, mettant en évidence l'efficacité du bloc de fusion dans la combinaison d'informations utiles provenant de modalités d'entrée variées. Les études d'ablation montrent que différents modules du bloc de fusion sont cruciaux pour la performance globale du modèle. De plus, nos études d'ablation soulignent également la capacité des différentes modalités d'entrée à améliorer les performances dans l'identification de différents types de matériaux. Le code source et les modèles pré-entraînés seront mis à disposition sur https://github.com/csiplab/MMSFormer.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Transformer

Segmentation Sémantique

Multimodal

Approche/Framework

Multimodal

Vision Par Ordinateur

Tâche

Md Kaykobad Reza; Ashley Prater-Bennette; M. Salman Asif

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Transformer

Segmentation Sémantique

Multimodal

Approche/Framework

Multimodal

Vision Par Ordinateur

Tâche

Md Kaykobad Reza; Ashley Prater-Bennette; M. Salman Asif

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

MMSFormer : Transformateur multimodal pour la segmentation matérielle et sémantique

Md Kaykobad Reza; Ashley Prater-Bennette; M. Salman Asif

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MMSFormer : Transformateur multimodal pour la segmentation matérielle et sémantique

Md Kaykobad Reza; Ashley Prater-Bennette; M. Salman Asif

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MMSFormer : Transformateur multimodal pour la segmentation matérielle et sémantique

Md Kaykobad Reza; Ashley Prater-Bennette; M. Salman Asif

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters