2ヶ月前

クロスドメイン顔表情認識:統一評価ベンチマークと敵対的グラフ学習

Chen, Tianshui ; Pu, Tao ; Wu, Hefeng ; Xie, Yuan ; Liu, Lingbo ; Lin, Liang
クロスドメイン顔表情認識:統一評価ベンチマークと敵対的グラフ学習
要約

異なる顔表情認識(Facial Expression Recognition: FER)データセット間のデータ不整合問題に対処するために、近年多くのクロスドメインFER手法(Cross-Domain FER: CD-FERs)が開発されてきました。各手法は優れた性能を達成すると主張していますが、ソース/ターゲットデータセットや特徴抽出器の選択が一貫していないため、公正な比較が不足しています。本研究では、まずこれらの選択による性能影響を分析し、次にいくつかの高性能なCD-FERと最近公開されたドメイン適応アルゴリズムを再実装しました。これら全てのアルゴリズムが同じソースデータセットと特徴抽出器を使用することで、公正なCD-FER評価を確保しています。現在の主要なアルゴリズムの多くは、ドメイン間の一貫性のある特徴を学習してドメインシフトを軽減するために敵対的学習(Adversarial Learning)を利用しています。しかし、これらのアルゴリズムは局所的な特徴を無視しており、これは異なるデータセット間でより移転可能であり、詳細な内容を持つため微細な適応に役立ちます。これらの課題に対処するため、我々は新たな敵対的グラフ表現適応(Adversarial Graph Representation Adaptation: AGRA)フレームワークを開発し、グラフ表現伝播と敵対的学習を統合してクロスドメイン全体-局所特徴共通適応を行いました。具体的には、まず各ドメイン内および異なるドメイン間での全体と局所領域の相関関係を示す2つのグラフを作成します。次に、入力画像から全体-局所特徴を抽出し、クラスごとの学習可能な統計分布を使用して対応するグラフノードを初期化します。最後に、2つのスタックされたグラフ畳み込みネットワーク(Graph Convolutional Networks: GCNs)を使用して、各ドメイン内の全体-局所特徴の相互作用を探りつつ、異なるドメイン間での全体-局所特徴共通適応を行います。我々は複数の人気ベンチマークに対して広範かつ公正な評価を行い、提案したAGRAフレームワークが以前の最先端手法よりも優れていることを示しました。

クロスドメイン顔表情認識:統一評価ベンチマークと敵対的グラフ学習 | 最新論文 | HyperAI超神経