
要約
細部セマンティックセグメンテーションタスク、例えば人間パーシングにおけるピクセルレベルのマスクのラベリングは、依然として困難な課題である。異なるセマンティック部分や類似した外観を持つカテゴリ間の曖昧な境界は通常、混乱を招き、真実値マスクに予期せぬノイズをもたらす。ラベルノイズを伴う学習の問題に対処するために、本研究ではSelf-Correction for Human Parsing (SCHP)と呼ばれる浄化戦略を導入し、監督ラベルの信頼性と学習モデルの性能を段階的に向上させる。特に、不正確なアノテーションで初期化されたモデルから出発し、循環的な学習スケジューラーを設計することで、オンラインで現在の学習済みモデルと以前の最適なモデルを反復的に集約してより信頼性のある疑似マスクを推定する。さらに、それに対応する修正されたラベルは逆にモデル性能の向上にも寄与する。この方法により、自己訂正学習サイクル中にモデルとラベルが相互に堅牢性と精度を高めていく。SCHPの優れた特性のおかげで、LIPおよびPascal-Person-Partデータセットを含む2つの主要な単一人間パーシングベンチマークで最高の性能を達成した。我々のシステム全体はCVPR2019 LIPチャレンジで1位となった。コードはhttps://github.com/PeikeLi/Self-Correction-Human-Parsing から入手可能である。