Sound Prompted Semantic Segmentation On
평가 지표
mAP
mIoU
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | mAP | mIoU |
---|---|---|
separating-the-chirp-from-the-chat-self | 32.7 | 24.7 |
jointly-discovering-visual-objects-and-spoken | 16.8 | 18.1 |
imagebind-one-embedding-space-to-bind-them | 19.7 | 20.5 |
contrastive-audio-visual-masked-autoencoder | 26.0 | 17.0 |