iNaturalist Sounds Dataset (iNatSounds) は、地球規模の市民科学プラットフォームである iNaturalist への寄稿者によって 2024 年に提出された音声ファイルのコレクションです。このデータセットは、世界中の 1,000 種以上の 5,500 種以上の音声を収録した 230,000 個の音声ファイルを収集しています。世界中の 27,000 人のロガーが貢献しました。このデータセットには、鳥、哺乳類、昆虫、爬虫類、両生類の鳴き声が含まれており、iNaturalist に送信された観察結果から得られた音声ラベルと種ラベルが付いています。
データセット内の各記録は長さが異なり、単一種の注釈が含まれています。弱いラベル付けにもかかわらず、この研究は、iNatSounds が事前トレーニング リソースとして堅牢であり、強力にラベル付けされた下流評価データセットと比較してパフォーマンスで優れていることを示しています。データセットは、自由にアクセスできる単一のアーカイブで提供され、この重要な分野でのアクセシビリティと研究を促進します。
iNatSounds のアプリケーションは有望であり、このデータに基づいてトレーニングされたモデルは、次世代の公共活動アプリケーションを強化し、生物学者、生態学者、土地管理者が大規模な音声コレクションを処理して、多様なサウンドスケープの構成のコンテキストを理解するのに役立つことが期待されています。
做种 0
下载中 0
已完成 12
总下载 17