HyperAI초신경

3주 이상 사용자가 투표한 6개의 클래식 머신 러닝 데이터 세트가 수집을 위해 권장됨

2년 전
정보
Jiaxin Sun
特色图像

한눈에 보는 콘텐츠: 이번 호에서는 이미지 인식, 기계 번역, 원격 감지 이미징 등의 분야를 포괄하여 슈퍼 신경망 다운로드 수가 가장 많은 6개 데이터 세트를 요약했습니다. 이러한 데이터 세트는 품질이 높고 용량이 크며, 인기가 인증되어 수집하고 보관할 가치가 있습니다. 키워드: 데이터셋, 기계 번역, 머신 비전

데이터 세트는 머신 러닝 모델 학습의 기초입니다. 고품질의 공개 데이터 세트는 모델 훈련 효과와 연구 결과의 신뢰성을 높이는 데 매우 중요합니다.

HyperAI는 출시 이후 데이터 과학 실무자들에게 수많은 고품질 공개 데이터 세트를 제공해 왔습니다.이번 호에서는 인기 있는 데이터세트 6개를 선정했습니다.총 32,569회 다운로드되었습니다.이 데이터 세트가 개발자들에게 더 큰 도움이 되기를 바랍니다~

참고: 이 기사에 정리된 데이터 세트는 모두 다음 웹사이트에서 가져온 것입니다.

6번: 탱크 사원 3D 재구성 데이터 세트

출판사:인텔 랩스

포함된 수량:21가지 종류의 물체를 담은 HD 영상

데이터 유형:동영상

예상 크기:52.53GB

출시 시간:2017

다운로드 주소:hyper.ai/데이터셋/5148

이미지에 캡션을 추가하세요. 최대 140자까지 가능합니다(선택 사항)

탱크 사원 이미지 데이터 세트는 연구자들이 이미지를 수집할 수 있는 고해상도 비디오를 제공합니다.이미지를 기반으로 3차원 재구성을 수행합니다.데이터 세트에는 훈련 데이터와 테스트 데이터의 두 가지 범주가 포함되어 있으며, 테스트 데이터는 중간 그룹과 고급 그룹으로 나뉩니다.

5번: DOTA 항공 이미지 데이터 세트

출판사:우한 대학교

포함된 수량:2,806개의 항공 사진

데이터 유형:이미지

예상 크기:35.38GB

출시 시간:2017

다운로드 주소:하이퍼.ai/데이터셋/4920

이미지에 캡션을 추가하세요. 최대 140자까지 가능합니다(선택 사항)

DOTA는 항공 사진에서 객체 감지를 위한 대규모 데이터 세트를 의미합니다. 이는 2,806개의 항공 사진을 포함하는 이미지 데이터 세트입니다.항공 사진에서 표적을 탐지하고 사진 속 객체를 찾아 평가하는 데 사용됩니다.

이러한 이미지 소스에는 다양한 센서와 플랫폼이 포함됩니다. 각 이미지의 픽셀 크기는 800*800에서 4000*4000까지이며, 다양한 크기, 방향, 모양의 객체를 포함합니다.

이전 릴리스를 보려면 다음을 방문하세요.

DOTA 데이터 세트: 2,806개의 원격 감지 이미지, 약 190,000개의 주석이 달린 인스턴스

4번: VGG-Face2 얼굴 인식 데이터 세트

출판사:옥스퍼드 대학교

포함된 수량:331만 개의 이미지

데이터 유형:이미지

예상 크기:37.49GB

출시 시간:2015

다운로드 주소:하이퍼.ai/데이터셋/5711

이미지에 캡션을 추가하세요. 최대 140자까지 가능합니다(선택 사항)

VGG-Face2는 총 9,131명의 얼굴 데이터를 포함하는 얼굴 이미지 데이터 세트입니다. 모든 이미지는 Google 이미지 검색에서 가져온 것입니다.데이터 세트에 있는 사람들은 자세, 나이, 인종, 직업이 매우 다양합니다.이 데이터 세트는 2015년 옥스퍼드 대학교 공학과 시각 기하학 그룹에서 공개되었으며, 관련 논문은 "딥 페이스 인식"입니다.

3번: UCAS-AOD 원격 감지 이미지 데이터 세트

출판사:중국과학원 대학교

포함된 수량:910개의 이미지

데이터 유형:이미지

예상 크기:3.24GB

출시 시간:2014

다운로드 주소:hyper.ai/데이터셋/5419

이미지에 캡션을 추가하세요. 최대 140자까지 가능합니다(선택 사항)

UCAS-AOD는 원격 감지 이미지 데이터 세트입니다.항공기 및 차량 검사용.이 데이터 세트는 2014년 중국과학기술대학교에서 처음 공개되었으며, 2015년에 보완되었습니다. 관련 논문으로는 "딥 컨볼루션 신경망을 이용한 항공 이미지에서의 방향 강건 객체 감지"가 있습니다.

2번: OpenMantra 만화 기계 번역 데이터 세트

출판사:도쿄대학교

포함된 수량:214페이지 분량의 만화

데이터 유형:JSON 파일, 이미지

예상 크기:32.46MB

출시 시간:2020

다운로드 주소:hyper.ai/데이터셋/14137

이미지에 캡션을 추가하세요. 최대 140자까지 가능합니다(선택 사항)

OpenMantra는 일본 만화에 대한 기계 번역 평가 데이터 세트로, 판타지, 로맨스, 전투, 미스터리, 일상 등 5가지 스타일의 만화를 포함하고 있습니다.이 데이터 세트에는 1,593개의 문장, 848개의 장면, 214페이지의 만화가 포함되어 있습니다.도쿄대학 만트라팀에서 출판.

이전 푸시를 확인하세요:

HyperAI: 만화 번역, 내장형 단어 AI, 도쿄대 논문 AAAI'21에 포함 3 좋아요 · 1 댓글

1위: ImageNet 10 이미지 인식 데이터 세트

출판사:프린스턴 대학교

포함된 수량:1500만 개의 이미지

데이터 유형:이미지

예상 크기:860.55GB

출시 시간:2009

다운로드 주소:hyper.ai/데이터셋/4889

이미지에 캡션을 추가하세요. 최대 140자까지 가능합니다(선택 사항)

ImageNet은 현재 세계에서 가장 큰 이미지 인식 데이터베이스로, 스탠포드 대학의 페이페이 리(Fei-Fei Li) 교수와 여러 연구자들이 만들었습니다.주로 머신 비전 분야의 이미지 분류 및 타겟 감지에 사용됩니다.

데이터 세트는 WordNet 계층 구조에 따라 구성되며, 각 노드(범주라고도 함)는 수백 개, 심지어 수천 개의 이미지로 구성됩니다. 이 데이터 세트에는 총 22,000개의 이미지 카테고리와 약 1,500만 개의 이미지가 포함되어 있습니다.

이전 릴리스를 보려면 다음을 방문하세요.

이 결정으로 페이페이 리는 AI 산업의 여왕이 되었습니다.mp.weixin.qq.com/s/VyKUmG512pFJ3XTgVf4Qjg


이번 호에서는 위의 6가지 hyper.ai에서 자주 다운로드되는 데이터 세트를 추천했습니다. 데이터 과학을 위한 더욱 고품질의 공개 데이터 세트를 보려면 기사 마지막 부분을 클릭하세요.원본 기사를 읽어보세요.또는 다음 링크를 방문하여 다운로드하세요.

본 기사는 위챗 공개 계정 "HyperAI Super Neural Network"에 처음 게재되었습니다.3주 이상 사용자가 투표한 6개의 클래식 머신 러닝 데이터 세트가 수집을 위해 권장됨

-- 위에--