2ヶ月前

大規模画像コレクションにおける非監督的な多目的発見へ向けた研究

Vo, Huy V. ; Pérez, Patrick ; Ponce, Jean
大規模画像コレクションにおける非監督的な多目的発見へ向けた研究
要約

本論文は、教師なしで画像の集合に含まれる物体を発見する問題を取り扱っています。Voら(CVPR'19)の最適化アプローチを基盤としつつ、以下の重要な新規性を導入しています:(1) 我々は、他の競合手法よりも著しく高い重複率を達成する新しい注目度に基づく領域提案アルゴリズムを提案します。この手続きは、バウンディングボックス情報なしで分類タスクに訓練された既存のCNN特徴量を利用しますが、それ以外は教師なしです。(2) 提案の固有の階層構造をVoらの物体発見アプローチの効果的な正則化器として利用し、その性能を大幅に向上させることで、いくつかの標準ベンチマークにおいて最先端技術を大きく上回る結果を得ています。(3) 全ての画像集合を使用して描かれている物体を発見する前に、小さなランダムな画像セットを使用して有望な提案を選択する二段階戦略を採用しています。これにより、我々は初めて(当社調べでは)最大20,000枚の画像からなるデータセット内の各画像における複数の物体発見に取り組むことができました。これは既存手法と比較して5倍以上の増加であり、真の大規模教師なし画像解釈への第一歩となります。

大規模画像コレクションにおける非監督的な多目的発見へ向けた研究 | 最新論文 | HyperAI超神経