13日前
3Dスキャンにおける深層学習を用いた6次元ボックスポーズ推定
Lukáš Gajdošech, Viktor Kocur, Martin Stuchlík, Lukáš Hudec, Martin Madaras

要約
自動化ロボットシステムは、一般的に高い耐障害性とフェイルセーフ性を備えつつ、相対的に高い精度と再現性を実現する必要がある。近年、3Dスキャンおよび画像処理タスクへのアプローチとして、深層学習に基づく手法が研究分野における標準となりつつあるが、産業界におけるこのデータ処理の標準は依然として解析的手法に依拠している。本論文では、解析的手法がより脆弱であり、検証・更新・保守が困難であると主張する。本研究は、3Dスキャンにおけるボックスの6次元(6D)ポーズ推定という特定のタスクに焦点を当てる。そのため、構造化光スキャナにより取得した実測スキャンと合成データから構成される高品質なデータセットを提示する。さらに、産業界標準である解析的手法と、データ駆動型のベースライン手法の2つの異なる6Dボックスポーズ推定手法を提案する。両手法を相互に評価し、実測スキャンデータに合成データを用いたトレーニングを導入することで、提案するデータ駆動型ニューラルモデルの性能が向上することを実験的に示した。本論文は位置論文(position paper)としての性質を持ち、提案手法は現在、比較的小規模な初期データセット上で訓練・評価されているが、今後このデータセットを拡張する予定である。