11日前

MUM:セミ監督学習型オブジェクト検出のための画像タイル混合と特徴タイル分離

JongMok Kim, Jooyoung Jang, Seunghyeon Seo, Jisoo Jeong, Jongkeun Na, Nojun Kwak
MUM:セミ監督学習型オブジェクト検出のための画像タイル混合と特徴タイル分離
要約

近年の半教師付き学習(SSL)の多くの研究では、教師-生徒アーキテクチャを構築し、教師モデルから生成された監視信号を用いて生徒ネットワークを学習する手法が採用されている。データ拡張戦略はSSLフレームワークにおいて重要な役割を果たしており、ラベル情報を損なうことなく弱い・強い入力ペアを生成することは困難である。特に、半教師付き物体検出(SSOD)への拡張においては、画像幾何学的変換や補間正則化に基づく多くの強力な拡張手法が利用しづらい。これは、物体検出タスクにおいてバウンディングボックスの位置情報に悪影響を及ぼす可能性があるためである。こうした課題に対処するため、本研究では、SSODフレームワーク向けに特化したシンプルかつ効果的なデータ拡張手法「Mix/UnMix(MUM)」を提案する。MUMは、混合された画像タイルに対して特徴空間上でタイルを再構成する「特徴タイルのアンミックス」を実行する。この手法により、混合された入力画像タイルを特徴空間で再構成可能となり、非補間的な疑似ラベルから得られる補間正則化効果を活用しつつ、意味のある弱い・強いペアを効果的に生成できる。さらに、MUMはさまざまなSSOD手法に容易に統合可能である。MS-COCOおよびPASCAL VOCデータセットにおける広範な実験により、MUMが全ての検証済みSSODベンチマークプロトコルにおいてベースラインに対して一貫してmAP性能を向上させることを示した。

MUM:セミ監督学習型オブジェクト検出のための画像タイル混合と特徴タイル分離 | 最新論文 | HyperAI超神経