11日前

半教師付きシャドウ検出のためのマルチタスク・ミーンテイチャー

{ Pheng-Ann Heng, Wei Feng, Song Wang, Liang Wan, Lei Zhu, Zhihao Chen}
半教師付きシャドウ検出のためのマルチタスク・ミーンテイチャー
要約

従来の影検出手法は、限定的なラベル付きデータセットに依存する本質的な制約を抱えており、複雑な状況下では性能が劣ることがある。本論文では、未ラベルデータを活用し、影に関する複数の情報を同時に学習することにより、半教師付き影検出の性能を向上させるため、マルチタスク・ミーンテイチャー(mean teacher)モデルを提案する。具体的には、まず、影領域、影のエッジ、影の数を同時に検出するマルチタスクベースラインモデルを構築し、その補完的な情報を活用して、このベースラインモデルを学生ネットワークおよび教師ネットワークに割り当てる。その後、未ラベルデータに対して、学生ネットワークと教師ネットワークの3つのタスクの予測が一貫性を持つように促し、その一貫性損失を計算する。この一貫性損失は、ラベル付きデータに対するマルチタスクベースラインモデルの予測から得られる教師付き損失に加算される。3つの広く用いられているベンチマークデータセットにおける実験結果から、本手法は比較対象の最先端手法を常に上回ることが示され、提案したネットワークが未ラベルデータを効果的に活用して影検出性能を向上させられることを実証した。