HyperAI초신경

세계 최초, 업계 최초: 우한대학교, 마스크 얼굴 인식 데이터 세트 소스 공개

5년 전
대형 공장 뉴스
神经小兮
特色图像

우한 대학은 세계 최초로 마스크로 가려진 얼굴 데이터 세트를 무료로 공개했습니다. 여기에는 마스크를 쓴 실제 얼굴과 일반 얼굴 이미지 약 10만 개와 마스크를 쓴 얼굴의 시뮬레이션 이미지 50만 개가 포함됩니다.

신종 코로나바이러스 폐렴과 싸우는 이 특별한 시기에, 우한대학교의 교사와 학생들은 과학 연구의 속도를 늦추지 않았습니다.
3월 초, 우한대학교 국가 멀티미디어 소프트웨어 기술 연구 센터는 특별한 얼굴 인식 데이터 세트를 공개했습니다.마스크로 가려진 얼굴 데이터 세트:실제 세계의 마스크를 쓴 얼굴 데이터 세트, RMFD로 약칭.

세계 최초의 실제 마스크 얼굴 데이터 세트

코로나19 팬데믹 당시에는 거의 모든 사람이 마스크를 착용했기 때문에 기존의 얼굴 인식 기술은 사실상 효과가 없었습니다.마스크로 가려진 얼굴 표정을 감지할 수 있는 얼굴 인식 기술은 전염병 기간 동안 시급한 필요성이 되었습니다.

3월 8일, 우한대학교 국가멀티미디어소프트웨어공학기술연구센터의 왕중위안 교수가 팀을 이끌고 마스크 안면인식에 대한 긴급 연구를 신속히 시작했습니다.

왕 중위안 교수는 황바오진, 홍치, 우하오 등 10명 이상의 대학원생으로 구성된 팀을 이끌고 처음에 36만 개의 얼굴 데이터를 수집하고 데이터 정리 및 라벨링과 같은 반자동 보조 생산 도구를 개발했다고 합니다.

팀의 Huang Jinbao가 프로그램 디버깅을 하고 있습니다.

데이터셋 ①: 5000개의 실제 마스크 얼굴 데이터셋 

마스크 얼굴 데이터 세트를 시뮬레이션하는 것 외에도,또한 이 팀은 525명의 마스크 얼굴 5,000개와 일반 얼굴 90,000개를 포함하는 세계 최초의 공개 실제 마스크 얼굴 인식 샘플 세트 RMFD를 구축했습니다.

실제 마스크 얼굴 샘플의 예


  데이터 세트 ② 및 ③: 50만 개의 시뮬레이션된 마스크 얼굴 데이터 세트(WebFace 시뮬레이션 및 LFW 시뮬레이션 포함) 

동시에, 데이터 다양성을 확대하기 위해 연구팀은 정밀한 마스크 착용 소프트웨어 프로그램을 개발했습니다.공개 데이터 세트에 있는 사람들의 얼굴에 마스크를 씌우는 방식으로, 우리는 10,000명의 사람과 500,000개의 얼굴로 구성된 시뮬레이션된 마스크 얼굴 데이터 세트를 구축했습니다.

마스크 착용 얼굴 인식 샘플 세트에는 마스크를 착용한 동일 인물의 얼굴 이미지와 마스크를 착용하지 않은 동일 인물의 얼굴 이미지가 여러 개 포함되어야 하며, 이를 구성하는 것은 어렵습니다.

따라서 마스크 얼굴 샘플 세트의 긴 생산 주기에 대응하여 팀은 4단계 반복적 R&D 기술 경로를 개발하고 4세트의 R&D 계획을 수립했습니다. 이를 통해 샘플 세트 상황과 모델 성능에 따라 시기적절한 조정과 선택이 가능합니다.

시뮬레이션된 마스크 얼굴 샘플의 예

현재 실제 마스크 얼굴 인식 데이터 세트와 시뮬레이션 마스크 얼굴 인식 데이터 세트는 대중에게 무료로 공개되었습니다. 시뮬레이션된 마스크 얼굴 인식 데이터 세트에는 WebFace와 LFW 시뮬레이션 마스크 얼굴 데이터 세트가 포함됩니다.

연구팀은 자신들이 구축한 데이터 세트를 기반으로 얼굴-눈썹 다중 세분성 마스크 가림 얼굴 인식 모델을 개발했습니다.데이터 세트에서 95%의 정확도를 달성했습니다. 

데이터 세트: 기여를 환영합니다 

또한, 데이터 세트를 더욱 확장하기 위해 팀은 모든 사람이 마스크 착용 사진 컬렉션을 보내주기를 환영합니다. x_zhangyang@whu.edu.cn, 수신된 사진을 통합된 방식으로 처리합니다.

이제 데이터 세트를 갖추었는데, 어떻게 다운로드하고 사용할 수 있을까요?

어떻게 다운로드하나요? 

마스크 얼굴 인식 데이터 세트_오픈 소스 다운로드 주소:

https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset

  어떻게 사용하나요? 

전염병이 창궐하는 동안 학교나 회사에서 컴퓨팅 능력을 얻을 수 없다면 어떻게 머신 러닝 작업을 계속할 수 있을까요?

이번에 소개할 파트너는 머신러닝을 위한 클라우드 컴퓨팅 파워를 제공하는 클라우드 서비스인 OpenBayes입니다. 그들은 대규모 슈퍼컴퓨팅 클러스터를 보유하고 있으며, GPU 클러스터 아키텍처는 특별히 매트릭스 컴퓨팅을 위해 설계되었습니다. AI 애플리케이션을 위한 컴퓨팅 파워 컨테이너를 제공하며, 시작하기가 매우 쉽고 바로 사용할 수 있습니다. 현재 OpenBayes의 컴퓨팅 파워 컨테이너 제품은 이미 다음을 지원합니다. TensorFlow, PyTorch, MXNet 및 기타 CPU 및 GPU 환경, 다양한 버전과 유형의 표준 머신 러닝 프레임워크와 다양한 공통 종속성.

현재 OpenBayes 컴퓨팅 컨테이너는 표준 라이브러리를 지원합니다.그리고 제공하다 CPU, NVIDIA T4, NVIDIA Tesla V100 및 기타 컴퓨팅 리소스방대한 데이터에 대한 중앙 집중식 학습이든 저전력 모델 상주 운영이든 사용자 요구 사항을 쉽게 충족할 수 있습니다.

CPU부터 T4, V100까지 다양한 컴퓨팅 컨테이너 구성 OpenBayes 지원스크립트 업로드 및 JupyterLab 편집기온라인 프로그래밍을 한 후 모델 훈련을 합니다.

명확하고 간결한 실행 프로세스전체 튜토리얼: https://openbayes.com/docs/quickstart/

새로운 사용자로 등록하고 GPU 컴퓨팅 파워를 즐겨보세요!

openbayes.com을 방문하세요, 공식 홈페이지를 클릭해 바로 등록하세요. 내부 테스트 기간 동안 매주 선물이 제공되니, 컴퓨팅 파워를 놓고 반 친구나 동료들과 경쟁할 필요가 없습니다~

데이터 세트는 공개 리소스에서 직접 사용/다운로드할 수 있습니다. 활동 설명  openbayes.com을 방문하세요  초대 코드 [HyperAI]를 사용하여 새로운 사용자로 등록하세요.즐길 수 있습니다주당 CPU 600분 + NVIDIA T4 300분  무료 컴퓨팅 파워~

-- 위에--