HyperAI超神経

世界初、業界初: 武漢大学のオープンソースのフェイスマスク顔認識データセット

5年前
大きな工場の事務
神经小兮
特色图像

武漢大学は、世界初のマスクで隠された顔データセットを無料で公開した。このデータセットには、マスクを着用した実際の顔と通常の顔の画像約10万枚と、マスクを着用した模擬顔の画像50万枚が含まれている。

新型コロナウイルス感染症と闘うこの特別な期間中、武漢大学の教師と学生は依然として科学研究のペースを緩めることはなかった。
3月初旬、武漢大学国立マルチメディアソフトウェア技術研究センターは特別な顔認識データセットを公開した——マスクで遮られた顔のデータセット:RMFD と呼ばれる現実世界のマスクされた顔データセット。

世界初のリアルマスク顔データセット

新型コロナウイルス感染症(COVID-19)の流行中、ほぼ全員がマスクを着用していたため、以前の顔認識技術は基本的に効果がなくなっていました。マスクの下での顔認識技術は、感染症の流行中、緊急のニーズとなっています。

3月8日、武漢大学国立マルチメディアソフトウェア工学技術研究センターのWang Zhongyuan教授はチームを率いて、マスクの顔認識に関する緊急研究を速やかに開始した。

報告によると、Wang Zhongyuan教授は、Huang Baojin氏、Hong Qi氏、Wu Hao氏を含む10人以上の大学院生からなるチームを率い、当初は36万件の顔データを収集し、データクリーニングやアノテーションなどの半自動補助制作ツールを開発したという。

チームのメンバーである黄金宝氏はプログラムをデバッグしています

データセット①:リアルマスク顔5000枚データセット 

シミュレートされたマスクの顔データセットに加えて、同チームはまた、525人の5,000のマスクの顔と90,000の通常の顔が含まれる世界初の公開リアルマスク顔認識サンプルセットRMFDを構築した。

実物マスク顔サンプル例


  データセット②、③:50万件のマスク顔シミュレーションデータセット(WebFaceシミュレーション、LFWシミュレーション含む) 

同時に、データの多様性を拡大するために、チームは正確なマスク着用のためのソフトウェア プログラムを開発しました。公開データ セット内の顔にマスクを装着することにより、10,000 人、500,000 の顔のシミュレートされたマスク顔データ セットが構築されました。

マスク顔認識サンプル セットには、マスクを着用している人とマスクを着用していない同じ人物の複数の顔画像が含まれている必要がありますが、これを構築するのは困難です。

したがって、フェイスマスクサンプルセットの長い生産サイクルを考慮して、チームはタイムリーな調整を行い、サンプルセットの条件と状況に基づいて最適なものを選択するために、4段階の反復的な研究開発技術ルートを策定し、4セットの研究開発計画を策定しました。モデルのパフォーマンス。

模擬マスク顔サンプルの例

現在、実際のマスク顔認識データセットと模擬マスク顔認識データセットの両方が無料で公開されています。模擬マスク顔認識データセットには、WebFace と LFW 模擬マスク顔データセットが含まれています。

彼らが確立したデータセットに基づいて、チームは顔と眉毛の多粒度マスクオクルージョン顔認識モデルを開発しました。データセットで 95% の精度を達成。 

データセット: あなたの貢献を歓迎します 

さらに、データセットをさらに拡大するために、チームは個人的に収集したマスクを着用している写真を送信することを歓迎します。 x_zhangyang@whu.edu.cn、受信した写真を均一に処理します。

データセットのダウンロードと使用方法

ダウンロード方法は? 

マスク顔認識データセット_オープンソースのダウンロードアドレス:

https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset

  使い方は? 

感染症の流行中、学校や企業のコンピューティング能力が得られない場合、どうやって機械学習タスクを継続できるのでしょうか?

今回紹介するパートナーは、機械学習のためのクラウドコンピューティングパワーを提供するクラウドサービスであるOpenBayesです。大規模なスーパーコンピューティング クラスターを備えており、GPU クラスター アーキテクチャはマトリックス コンピューティング用に特別に設計されており、AI アプリケーションにコンピューティング パワー コンテナーを提供します。これは開始するのが非常に簡単で、すぐに使用できます。現在、OpenBayes のコンピューティング パワー コンテナ製品はすでにサポートされています。 TensorFlow、PyTorch、MXNet などの CPU および GPU 環境で。、標準的な機械学習フレームワークのさまざまなバージョンとタイプ、およびさまざまな共通の依存関係。

OpenBayes コンピューティング パワー コンテナーで現在サポートされている標準ライブラリそして提供します CPU、NVIDIA T4、NVIDIA Tesla V100、その他のコンピューティング リソース、大規模なデータの集中トレーニングでも、低電力モデルの常駐操作でも、ユーザーのニーズに簡単に対応できます。

CPUからT4、V100まで、豊富なコンピューティングパワーコンテナ構成 オープンベイズのサポートスクリプトのアップロードと JupyterLab エディターオンライン プログラミングとその後のモデル トレーニング。

明確かつ簡潔な実行プロセス完全なチュートリアル: https://openbayes.com/docs/quickstart/

新規ユーザーとして登録して、GPU のコンピューティングパワーをお楽しみください!

openbayes.com にアクセスしてください、公式ウェブサイトのホームページをクリックしてすぐに登録すると、内部テスト期間中は毎週無料のギフトが提供されるため、クラスメートや同僚とコンピューティング能力を競う必要はもうありません~

データセットは公開リソースから直接使用/ダウンロードできます。 アクティビティの説明  openbayes.com にアクセスしてください  招待コード【HyperAI】で新規ユーザー登録楽しむ準備はできています週あたり 600 分の CPU + 300 分の NVIDIA T4  無料のコンピューティングパワー~

- 以上 -