11日前

オブジェクトパーツの自己教師学習による意味分割

Adrian Ziegler, Yuki M. Asano
オブジェクトパーツの自己教師学習による意味分割
要約

自己教師あり学習の進展により、強力な汎用的な画像表現学習手法が実現されてきた。しかし、これまでの研究は主に画像レベルの学習に注目しており、空間的に多様な表現を必要とするタスク、例えば無教師画像セグメンテーションは、このトレンドの恩恵を十分に受けていない。その理由は、密な表現(dense representations)を学習することが困難であるためであり、特に無教師設定下では、モデルがさまざまな潜在的な物体カテゴリに対応する表現を学習するように導く明確な指針が存在しないためである。本論文では、物体の部分(object parts)の自己教師あり学習がこの課題に対する解決策であると主張する。物体の部分は汎化性が高く、事前に特定の物体定義に依存しない一方で、事後的にそれらを統合することで物体を構成できる。この目的のために、最近提案されたVision Transformerが物体に注目する能力を活用し、空間的に密なクラスタリングタスクを用いて空間的トークンの微調整を行う。提案手法は、3つのセマンティックセグメンテーションベンチマークにおいて、従来の最先端手法を17%~3%上回り、異なる物体定義に対しても表現が柔軟に適応できることを示した。さらに、テスト時にもラベル情報を一切使用しない完全無教師セグメンテーションへと拡張し、コミュニティ検出に基づく単純な自動結合手法が著しい性能向上をもたらすことを実証した。

オブジェクトパーツの自己教師学習による意味分割 | 最新論文 | HyperAI超神経