2ヶ月前
モバイルデバイスにおける任意のステレオ画像の深度推定
Yan Wang; Zihang Lai; Gao Huang; Brian H. Wang; Laurens van der Maaten; Mark Campbell; Kilian Q. Weinberger

要約
ロボット工学におけるステレ奥行き推定の多くの応用においては、計算リソースに大きな制約があるにもかかわらず、リアルタイムで正確な視差マップを生成する必要があります。現行の最先端アルゴリズムでは、精度の高いマッピングを遅い速度で生成するか、または高速に生成するが精度が低いマッピングを選択しなければならないという課題があります。さらに、これらの手法は通常、電力やメモリに制約のあるデバイスで使用するにはパラメータ数が多すぎることが問題となっています。これらの欠点を解決するために、我々はアニタイム設定での視差予測の新しいアプローチを提案します。従来の研究とは異なり、我々のエンドツーエンド学習アプローチでは推論時に計算量と精度のトレードオフが可能です。奥行き推定は段階的に行われ、モデルは任意のタイミングでクエリされ、現在の最良の推定値を出力することができます。最終的なモデルはNVIDIA Jetson TX2モジュール上で1242×375解像度の画像を10-35 FPSの範囲で処理でき、誤差は僅かな増加に留まります -- 最も競争力のあるベースラインと比較してパラメータ数が2桁少ない条件下でもです。ソースコードはhttps://github.com/mileyan/AnyNet から利用可能です。