11日前

ラベル付きデータが限られた状況下における顔属性認識のための空間的・意味的関係学習

{Hanzi Wang, Chunhua Shen, Jing-Hao Xue, Si Chen, Yan Yan, Ying Shu}
ラベル付きデータが限られた状況下における顔属性認識のための空間的・意味的関係学習
要約

深層学習の最近の進展により、顔貌属性認識(Facial Attribute Recognition, FAR)において優れた成果が得られており、通常は大規模なラベル付きデータを用いて学習が行われる。しかし、実世界における多くのFAR応用シーンでは、ラベル付きデータが限られているため、従来の深層学習ベースのFAR手法の性能は著しく低下する傾向にある。この問題に対処するため、本研究では「空間的・意味的パッチ学習(Spatial-Semantic Patch Learning, SSPL)」と呼ばれる手法を提案する。SSPLの学習プロセスは2段階から構成される。第一段階では、大規模なラベルなし顔画像データから空間的・意味的関係を学習するために、パッチ回転タスク(Patch Rotation Task, PRT)、パッチセグメンテーションタスク(Patch Segmentation Task, PST)、パッチ分類タスク(Patch Classification Task, PCT)の3つの補助タスクを共同で設計する。これにより、強力な事前学習モデルが得られる。特に、PRTは自己教師学習の枠組みで顔画像の空間情報を活用する。一方、PSTとPCTは顔解析モデルに基づき、それぞれ画素レベルおよび画像レベルの意味情報を捉える。第二段階では、これらの補助タスクを通じて学習された空間的・意味的知識を、FARタスクに転移する。このアプローチにより、事前学習モデルの微調整に極めて少ないラベル付きデータで十分となる。広範な実験と分析を通じて、本手法が最先端手法と比較して優れた性能を達成していることが実証された。

ラベル付きデータが限られた状況下における顔属性認識のための空間的・意味的関係学習 | 最新論文 | HyperAI超神経