Sound Prompted Semantic Segmentation On
評価指標
mAP
mIoU
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | mAP | mIoU |
---|---|---|
separating-the-chirp-from-the-chat-self | 32.7 | 24.7 |
jointly-discovering-visual-objects-and-spoken | 16.8 | 18.1 |
imagebind-one-embedding-space-to-bind-them | 19.7 | 20.5 |
contrastive-audio-visual-masked-autoencoder | 26.0 | 17.0 |