HyperAIHyperAI

Command Palette

Search for a command to run...

野生の顔画像から年齢と性別を分類するためのハイブリッドトランスフォーマー-シーケンサー手法

Aakash Singh Vivek Kumar Singh

概要

コンピュータビジョンと画像処理技術の進歩により、視覚監視、ターゲット広告、コンテンツベースの検索、および人間-コンピュータ相互作用などの新しい応用が生まれています。これらの技術の中で、特に顔分析が注目を集めています。これまでの多くの研究では、年齢や性別分類を含む様々なタスクのために顔特徴処理の異なる応用を探索しようと試みられてきました。しかし、実世界のアプリケーションに必要な精度レベルを達成するには、野生環境下の人間の顔の年齢と性別分類はまだ遠い道のりとなっています。本論文では、このギャップを埋めるために、自己注意(self-attention)と双方向LSTM(BiLSTM)アプローチを組み合わせたハイブリッドモデルを提案します。提案されたモデルの性能は、これまでに提唱された最新鋭のモデルと比較されました。結果として、年齢分類では約10%、性別分類では約6%の改善が確認されました。したがって、提案されたモデルは優れた性能を達成し、より一般的な学習を提供することが示されています。このモデルは、様々な画像処理やコンピュータビジョン問題における核心的な分類部品として適用できると考えられます。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています