Multi Modal Classification On Vgg Sound
Metriken
Top-1 Accuracy
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Top-1 Accuracy |
---|---|
uavm-a-unified-model-for-audio-visual | 65.8 |
multiscale-multimodal-transformer-for | 66.2 |
contrastive-audio-visual-masked-autoencoder | 65.9 |
avt-audio-video-transformer-for-multimodal | 63.9 |