3ヶ月前

CamLessMonoDepth:未知カメラパラメータを用いたモノクローナル深度推定

Sai Shyam Chanduri, Zeeshan Khan Suri, Igor Vozniak, Christian Müller
CamLessMonoDepth:未知カメラパラメータを用いたモノクローナル深度推定
要約

3次元情報の認識は、コンピュータビジョンの多くの応用において極めて重要な役割を果たす。近年の単眼深度推定の進展により、教師データ(真値)を必要とせずに、深層ニューラルネットワークを用いて逆深度およびカメラポーズを予測することにより、単一のカメラ入力からそのような知識を得ることが可能であることが示された。しかし、これらの大多数の手法は、訓練中にカメラパラメータを明示的に入力する必要がある。その結果、野外で取得された画像シーケンスは訓練に利用できなくなってしまう。カメラ内部パラメータ(インターンス)も予測する手法は存在するが、それらの性能は、カメラパラメータを入力として用いる最新の手法に比べて劣っている。本研究では、単眼画像シーケンスのみから、ピンホールカメラの内部パラメータをimplicit(暗黙的)に推定するとともに、深度およびポーズを同時に推定する手法を提案する。さらに、効率的なサブピクセル畳み込みを活用することで、高精度な深度推定が可能であることを示す。また、ピクセル単位の不確実性推定をフレームワークに組み込むことで、本手法の実用分野への応用可能性を強調している。最終的に、カメラ内部パラメータに関する事前知識がなくても正確な深度推定が可能であることを実証し、KITTIベンチマークにおいて既存の最先端手法を上回る性能を達成した。