2ヶ月前
ARBEx: 注意力付き信頼性バランス特徴抽出による堅牢な顔表情学習
Wasi, Azmine Toushik ; Šerbetar, Karlo ; Islam, Raima ; Rafi, Taki Hasan ; Chae, Dong-Kyu

要約
本論文では、Vision Transformerを駆動し、信頼性のバランスを取りながら不良なクラス分布、バイアス、および不確実性に対処する新しい注目特徴抽出フレームワークARBEx(Attentive Reliability Balancing Extraction)を紹介します。データ前処理と精製手法を強化し、ウィンドウベースのクロスアテンションViT(Vision Transformer)を使用してデータから最大限の情報を引き出します。また、埋め込み空間内の学習可能なアンカーポイントとラベル分布、マルチヘッド自己注意機構を用いて、信頼性のバランスを取りながら弱い予測に対する性能を最適化します。信頼性のバランスは、アンカーポイント、注意スコア、および信頼度値を利用してラベル予測の堅牢性を向上させる戦略です。正解ラベル分類を確保し、モデルの識別力を向上させるために、アンカーロスを導入しました。これはアンカーポイント間の大マージンを促進します。さらに、学習可能なマルチヘッド自己注意機構は正確なラベル識別に重要な役割を果たします。この手法は予測の信頼性向上に不可欠な要素を提供し、最終的な予測能力に大きなプラスの影響を与えます。当社の適応型モデルは任意の深層ニューラルネットワークと統合可能で、さまざまな認識タスクにおける課題に対処できます。多数の状況下で行われた広範な実験によれば、当社の戦略は現行の最先端手法を超える性能を示しています。