2ヶ月前

野生の顔画像から年齢と性別を分類するためのハイブリッドトランスフォーマー-シーケンサー手法

Singh, Aakash ; Singh, Vivek Kumar
野生の顔画像から年齢と性別を分類するためのハイブリッドトランスフォーマー-シーケンサー手法
要約

コンピュータビジョンと画像処理技術の進歩により、視覚監視、ターゲット広告、コンテンツベースの検索、および人間-コンピュータ相互作用などの新しい応用が生まれています。これらの技術の中で、特に顔分析が注目を集めています。これまでの多くの研究では、年齢や性別分類を含む様々なタスクのために顔特徴処理の異なる応用を探索しようと試みられてきました。しかし、実世界のアプリケーションに必要な精度レベルを達成するには、野生環境下の人間の顔の年齢と性別分類はまだ遠い道のりとなっています。本論文では、このギャップを埋めるために、自己注意(self-attention)と双方向LSTM(BiLSTM)アプローチを組み合わせたハイブリッドモデルを提案します。提案されたモデルの性能は、これまでに提唱された最新鋭のモデルと比較されました。結果として、年齢分類では約10%、性別分類では約6%の改善が確認されました。したがって、提案されたモデルは優れた性能を達成し、より一般的な学習を提供することが示されています。このモデルは、様々な画像処理やコンピュータビジョン問題における核心的な分類部品として適用できると考えられます。

野生の顔画像から年齢と性別を分類するためのハイブリッドトランスフォーマー-シーケンサー手法 | 最新論文 | HyperAI超神経