Multi Modal Classification On Vgg Sound
Métriques
Top-1 Accuracy
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Top-1 Accuracy |
---|---|
uavm-a-unified-model-for-audio-visual | 65.8 |
multiscale-multimodal-transformer-for | 66.2 |
contrastive-audio-visual-masked-autoencoder | 65.9 |
avt-audio-video-transformer-for-multimodal | 63.9 |