
要約
行動認識用の新しい公開動画データセット「多国間匿名動画(Anonymized Videos from Diverse countries, AViD)」を紹介する。既存の公開動画データセットとは異なり、AViDは多数の異なる国から収集された行動動画の集積である。本データセットの開発の動機は、特定の限られた国に偏ったデータに依存するのではなく、すべての研究者・開発者にとって行動認識モデルの学習および事前学習に有益な公共データセットを提供することにある。さらに、AViDの動画に含まれる顔の個人情報を適切に匿名化することで、個人のプライバシーを保護している。また、AViDは静的データセットであり、各動画はクリエイティブ・コモンズ(Creative Commons)ライセンスに基づいて公開されている。我々は、既存の多数の動画データセットが統計的に限定された少数の国からの行動動画に偏っていることを確認した。実験的に、こうした偏りのあるデータセットで学習されたモデルは、他の国からの行動動画に対して完全な汎化性能を発揮しないことを示した。一方で、AViDがこうした問題を効果的に緩和できることを実証した。さらに、AViDがモデルの事前学習に適した優れたデータセットとして機能することを確認しており、従来のデータセットと比較して同等あるいはそれ以上の性能を発揮することが明らかになった。