2ヶ月前

非監督学習による物体フレームの学習と密集等変画像ラベリング

James Thewlis; Hakan Bilen; Andrea Vedaldi
非監督学習による物体フレームの学習と密集等変画像ラベリング
要約

視覚認識の主要な課題の一つは、視覚測定値から3次元物体や物体カテゴリーの抽象モデルを抽出することである。これらの測定値は、視点、隠蔽、運動、変形などの複雑な妨害要因によって影響を受けている。最近の視点分解のアイデアに基づいて、我々は新たな手法を提案する。この手法は、ある物体の大量の画像と他の監督情報なしで、密度の高いオブジェクト中心座標系を抽出できる。この座標系は画像の変形に対して不変であり、画像ピクセルを対応する物体座標にマッピングする密度の高い同変ラベリングニューラルネットワークが付属している。我々はこの手法が単純な可動部を持つ物体や人間の顔のような変形可能な物体にも適用可能であることを示す。ランダムな合成変換や光流対応から埋め込みを学習し、一切の人手による監督なしで行うことができる。以上が原文に基づいた日本語訳です。

非監督学習による物体フレームの学習と密集等変画像ラベリング | 最新論文 | HyperAI超神経