HyperAI
Command Palette
Search for a command to run...
VGG-SS音源定位データセット

VGG-SSはVGG Sound Sourceの正式名称であり、音源定位を評価するためのビデオデータセットです。このデータセットには、200 を超えるカテゴリ、5000 のビデオ、および VGG-Sound データセットの新しい注釈が含まれており、既存のデータセットの 10 倍の大きさです。各ビデオ クリップ内の可視音源は、境界ボックスで明確にラベル付けされています。 Flickr SoundNet とは異なり、このデータセットの音源定位はビデオベースです。
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。