HyperAIHyperAI

Command Palette

Search for a command to run...

MixAugmentおよびMixup:顔認識表情認識のための増強手法

Andreas Psaroudakis Dimitrios Kollias

概要

過去20年間、顔面表情は人間のコミュニケーションにおいて中心的な役割を果たすため、自動顔面表情認識(FER: Automatic Facial Expression Recognition)はますます注目を集めている。多くのFER手法は、データ解析において強力なツールとして機能する深層ニューラルネットワーク(DNN: Deep Neural Networks)を活用している。しかし、その強力さにもかかわらず、これらのネットワークは過学習(overfitting)を起こしやすいという問題がある。これは、しばしば訓練データを記憶してしまう傾向があるためである。さらに、現在のところ、実際の環境(非制約環境、いわゆるin-the-wild)において利用可能な大規模なFERデータベースは限られている。この課題を緩和するため、いくつかのデータ拡張(data augmentation)技術が提案されてきた。データ拡張とは、元のデータに対して制約付きの変換を施すことにより、利用可能なデータの多様性を高める手法である。その中でも、さまざまな分類タスクにおいて良好な効果を示した手法として、Mixupがある。Mixupでは、DNNが例示データのペアとその対応するラベルの凸結合(convex combination)上で学習される。本論文では、顔の向き、照明条件、背景、文脈などに大きなばらつきを示すin-the-wild FERにおいて、Mixupの有効性を検証する。さらに、Mixupを基盤とする新たなデータ拡張戦略、すなわちMixAugmentを提案する。MixAugmentでは、仮想例と実際の例の両方を同時に用いてネットワークを学習させ、これらのすべての例が全体の損失関数に寄与する。広範な実験により、MixAugmentがMixupおよびさまざまな最先端手法を上回る有効性を実証した。また、ドロップアウトとMixup、MixAugmentの組み合わせ、および他のデータ拡張手法とMixAugmentの統合についても検討を行った。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
MixAugmentおよびMixup:顔認識表情認識のための増強手法 | 記事 | HyperAI超神経