13日前
現実世界における点群からのスケーラブルなシーンフロー
Philipp Jund, Chris Sweeney, Nichola Abdo, Zhifeng Chen, Jonathon Shlens

要約
自律走行車は、常に変化する環境下で動作するため、シーン内のどの部分が動いているか、そしてその動きの先がどこにあるかを正確に評価する必要がある。3次元(3D)の動き推定において、広く用いられる手法として「シーンフロー(scene flow)」がある。これは、連続するLiDARスキャンから得られる3Dポイントクラウドデータを活用するものであるが、現実世界のアノテーション付きLiDARデータの規模が小さかったため、従来のアプローチには限界があった。本研究では、対応する追跡された3Dオブジェクトに基づいて構築された、シーンフロー推定用の大規模データセットを紹介する。このデータセットは、アノテーション付きフレーム数の観点から、従来の実世界データセットと比較して約1,000倍の規模を有している。我々は、これまでの研究が利用可能な実LiDARデータの量に制限されていたことを示し、最先端の予測性能を達成するためには、より大規模なデータセットが必要であることを示唆する。さらに、ポイントクラウド処理に用いられる従来のヒューリスティクス(例:ダウンサンプリング)が性能を著しく低下させることを明らかにし、フルポイントクラウド上で効率的に処理可能な新たなモデルアーキテクチャの必要性を示唆する。この課題に対応して、本研究ではフルポイントクラウド上でリアルタイム推論を実現するFastFlow3Dアーキテクチャを提案する。また、自車運動(ego-motion)を考慮し、オブジェクト種別ごとの分解を提供することで、現実世界の特性をより適切に捉えることができる人間が理解可能な評価指標も設計した。本データセットが、現実世界におけるシーンフローシステムの開発に新たな機会を提供することを期待する。