11日前
Objectron:ポーズアノテーション付きの野外オブジェクト中心動画の大規模データセット
Adel Ahmadyan, Liangkai Zhang, Jianing Wei, Artsiom Ablavatski, Matthias Grundmann

要約
3Dオブジェクト検出は、ロボット工学、拡張現実(AR)、自律走行、画像検索など多くの応用分野における重要性から、近年注目を集めています。本研究では、3Dオブジェクト検出の最先端技術を推進し、3Dオブジェクトトラッキング、ビュー合成、および高精度な3D形状表現といった新たな研究や応用を促進するため、Objectronデータセットを紹介します。このデータセットは、9つのオブジェクトカテゴリを対象としたオブジェクト中心の短時間動画を含み、各動画に姿勢(ポーズ)のラベルが付与されています。全体で14,819本のラベル付き動画、合計400万枚のラベル付き画像を収録しています。さらに、3Dオブジェクト検出に適した新しい評価指標として「3Dインターセクションオーバーユニオン(3D IoU)」を提案しました。本データセットの有効性を実証するため、このデータセット上で学習されたベースラインモデルを提供しています。本データセットおよび評価用ソースコードは、オンラインで公開されており、URLは http://www.objectron.dev です。