16日前

RePOSE:ディープテクスチャレンダリングを用いた高速6次元オブジェクトポーズの微調整

Shun Iwase, Xingyu Liu, Rawal Khirodkar, Rio Yokota, Kris M. Kitani
RePOSE:ディープテクスチャレンダリングを用いた高速6次元オブジェクトポーズの微調整
要約

本稿では、6次元物体姿勢推定の高速反復精緻化手法であるRePOSEを提案する。従来の手法は、ズームインした入力画像とレンダリングされたRGB画像をCNNに投入し、精緻化された姿勢の更新量を直接回帰する方式を採用している。しかし、CNNの計算コストが高く、特に複数物体の姿勢精緻化において顕著な遅延が生じるという課題がある。この問題を解決するために、RePOSEは学習可能なテクスチャを備えた3Dモデルを用いて画像レンダリングを活用し、高速な特徴抽出を実現する。このアプローチを「深層テクスチャレンダリング」と呼ぶ。本手法では、浅層の多層パーセプトロン(MLP)を用いて、視点不変の画像表現を直接回帰する。さらに、入力画像とレンダリング画像の表現間の特徴距離誤差を最小化する目的で、微分可能なレーベンバーグ・マーカート法(Levenberg-Marquardt: LM)最適化を活用することで、ズームインを必要とせずに高速かつ高精度な姿勢精緻化を実現する。これらの画像表現は、微分可能なLM最適化が数反復で収束するように学習される。その結果、RePOSEは92 FPSの実行速度を達成し、Occlusion LineMODデータセットにおいて51.6%の最先端の精度を実現。従来手法と比較して4.1%の絶対的な性能向上を達成した。また、YCB-Videoデータセットにおいても同程度の性能を維持しつつ、大幅な高速化を実現した。コードは以下のURLから公開されている:https://github.com/sh8/repose。

RePOSE:ディープテクスチャレンダリングを用いた高速6次元オブジェクトポーズの微調整 | 最新論文 | HyperAI超神経