Cross Modal Retrieval On Soundingearth
評価指標
Image-to-sound R@100
Median Rank
Sound-to-image R@100
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Image-to-sound R@100 | Median Rank | Sound-to-image R@100 |
---|---|---|---|
learning-tri-modal-embeddings-for-zero-shot | 0.434 | 159 | 0.434 |
self-supervised-audiovisual-representation | 0.291 | 565 | 0.250 |