2ヶ月前

ローカル集約による視覚埋め込みの非監督学習

Chengxu Zhuang; Alex Lin Zhai; Daniel Yamins
ローカル集約による視覚埋め込みの非監督学習
要約

ニューラルネットワークにおける教師なし学習手法は、大量の高コストなアノテーションを必要とせずにネットワークの訓練が可能となることや、人間が行う汎用的な学習のモデルとしてより適していることから、人工知能の発展に大きな関心を集めています。しかし、教師なしネットワークは特に大規模な視覚認識の分野において、教師ありネットワークの性能に長年及ばない状況が続いていました。最近では、非パラメトリックインスタンス分離とクラスタリング目的関数を最大化する深層畳み込み埋め込みの訓練に関する進展があり、このギャップを縮める可能性が示されています。本稿では、局所集約指標を最大化する埋め込み関数を訓練する方法について説明します。この方法により、類似したデータインスタンスは埋め込み空間内で一緒に移動し、非類似のインスタンスは分離することが可能となります。この集約指標は動的であり、異なるスケールでのソフトクラスタリングが形成されるようになっています。我々はいくつかの大規模視覚認識データセットで当該手順を評価し、ImageNetでの物体認識、Places 205でのシーン認識、PASCAL VOCでの物体検出において最先端の教師なし転移学習性能を達成しました。

ローカル集約による視覚埋め込みの非監督学習 | 最新論文 | HyperAI超神経