Kaggle 연례 보고서 발표: 데이터 과학자들은 젊고 부유하며 연봉은 백만 달러에 육박

2020년도 곧 끝나가고, Kaggle에서 연례 설문 조사 보고서인 "머신러닝과 데이터 과학 2020"을 발표했는데, 이 보고서에서는 현재 데이터 과학자들의 그룹 초상화를 볼 수 있습니다.
데이터 분석 경연 플랫폼인 카글(Kaggle)은 최근 플랫폼 사용자를 대상으로 설문조사를 실시했습니다. 설문조사에는 실무자의 기본 정보, 급여 수준, 업무 경험 등 다양한 측면이 포함되었습니다.
20,036명의 Kaggle 사용자로부터 피드백을 수집하여 데이터 정리를 거친 후, Kaggle은 마침내 13%(2,675)명의 응답자를 대상으로 이 보고서를 작성했습니다. 이 응답자들은 모두 현재 데이터 과학자로 일하고 있거나 데이터 과학과 머신 러닝을 지원하는 다른 직책에 종사하고 있습니다.

현재 최신 조사 보고서가 공개되었습니다. 이 보고서를 통해 머신 러닝 및 데이터 과학 실무자들의 현재 상황과 이 분야 관련 기업의 고용 및 자본 투자 현황을 개괄적으로 살펴보고, 업계의 최신 개발 동향을 살펴볼 수 있습니다.
참고: 이 설문조사에는 중국 데이터 과학자에 대한 데이터가 없습니다. Super Neuro는 조사 결과 Kaggle의 설문조사 참여 규칙에 다음과 같은 규칙이 있다는 것을 발견했습니다.
이 설문조사에서 상품을 받으려면 다음 조건을 충족해야 합니다.
18세 이상이거나 귀하가 거주하는 국가의 시민권 연령입니다.
저는 아르메니아, 쿠바, 이란, 시리아, 북한, 수단의 국민이 아닙니다.
미국 수출 통제 또는 제재의 대상이 되는 개인이나 단체의 대표자가 아닙니다.

2018년 이래로 미국은 수출 통제 또는 제재를 위해 200개가 넘는 중국 기업과 13개 대학을 "엔티티 리스트"에 포함시켰습니다. 우리는 다음과 같이 기술 및 인공지능 분야의 대학과 몇몇 회사의 목록을 정리했습니다.
기업
베이징 계산과학 연구 센터, 베이징 클라우드 컴퓨팅 센터, SMIC, 다화 테크놀로지, 히크비전, 아이플라이텍, 메그비 테크놀로지, 센스타임, 이투 테크놀로지, 클라우드워크 테크놀로지, 인텔리퓨전 테크놀로지 주식회사, 넷포사 테크놀로지 주식회사, 베이징 클라우드마인즈, 치후 360 테크놀로지 주식회사, 샤먼 메이야 피코 정보 주식회사, 이신 테크놀로지, 38개 화웨이 자회사, 중국전자과기그룹 주식회사 제30연구소, 중국전자과기그룹 주식회사 제7연구소, 우시 장난 컴퓨팅 기술 연구소.
대학 및 대학교
베이징 항공우주대학, 중국 인민대학, 국방과학기술대학, 후난대학, 하얼빈 공업대학, 하얼빈 공학대학, 서북이공대학, 시안 교통대학, 중국 전자과학기술대학, 쓰촨대학, 통지대학, 광동이공대학, 난창대학.
즉, 귀하의 학교 또는 회사가 Entity List에 있는 한 설문지는 작성할 수 있지만, 수상 평가에는 참여할 수 없습니다. 추가적인 배경 조사나 성명은 없었지만 Kaggle은 구체적으로 많은 중국인의 참여를 거부했습니다.
간결한 버전 보고서: 데이터 과학자들의 그룹 초상화
성별, 연령 및 교육 분포
- 이 분야에는 여성보다 남성이 더 많이 일하고 있으며, 남성과 여성의 비율은 약 5:1입니다.
- 35세는 분수령이며, 응답자의 대부분이 35세 미만입니다.
- 응답자의 절반 이상이 대학원 학위를 소지하고 있습니다.
교육 및 업무 경험
- 대부분의 데이터 과학자들은 졸업 후에도 계속해서 새로운 기술을 배웁니다.
- 대부분의 데이터 과학자는 10년 미만의 기간 동안 프로그래밍을 해왔습니다.
- 데이터 과학자의 절반 이상이 머신 러닝 분야에서 3년 미만의 경험을 가지고 있습니다.
- 미국에 거주하는 데이터 과학자들은 다른 나라에 거주하는 데이터 과학자들보다 훨씬 더 많은 돈을 번다.
기술 관련 설문조사
- 2019년보다 더 많은 데이터 과학자가 클라우드 컴퓨팅을 사용합니다.
- Scikit-Learn은 4/5명의 데이터 과학자가 사용하는 가장 많이 사용되는 머신 러닝 도구입니다.
- Tableau와 PowerBI는 가장 인기 있는 비즈니스 인텔리전스 도구입니다.
대부분 남성이고 1인당 석사 학위를 보유한 인도가 목록을 지배합니다.
성별: 80% 이상이 남성입니다
데이터 과학자들 사이에서는 여전히 엄청난 성별 불균형이 존재하며, 80% 이상이 남성입니다.

연령 : 95세 이상 가입
데이터 과학자는 대체로 20대 또는 30대 초반, 즉 22세에서 34세 사이입니다.전문 데이터 과학자 5명 중 40세가 넘는 사람은 1명에 불과합니다.

데이터 과학자의 나이는 25세에서 34세 사이입니다.
"Z세대"가 데이터 활동에 더욱 적극적으로 참여하면서 데이터 과학자의 연령이 점점 낮아지고 있다는 징후가 나타나고 있습니다. 현재 7%의 데이터 과학자 중 18~21세가 가장 많습니다.
이는 작년 5%에 비해 증가한 수치로, 앞으로 이 그룹이 점점 더 젊어질 것으로 예측된다.
국가: 인도와 미국이 목록의 상위에 올랐습니다.
Kaggle의 연례 설문 조사에 참여한 데이터 과학자 중 인도의 데이터 과학자는 22%를 차지한 반면, 미국은 14.5%를 차지했는데, 두 국가 모두 3위를 차지한 브라질(5% 미만)보다 훨씬 높았습니다.
보고서는 여러 가지 이유로 중국을 명시적으로 포함하지 않았지만, 3위에 오른 기타 사용자의 숫자가 적지 않은 것은 아마도 유효한 통계 결과에 중국 사용자를 포함하려는 의도 때문일 것입니다.

학력: 대학원 학위가 표준입니다.
조사에 따르면, 지난 몇 년과 마찬가지로 데이터 과학자에게는 대학원 학위가 여전히 표준으로 남아 있습니다.68%의 데이터 과학자 중 681명 이상이 석사 또는 박사 학위를 취득했습니다.5%의 데이터 과학자 중 고등학교 졸업 이상의 교육을 받지 못한 사람은 51명 미만입니다.

학습 플랫폼: Coursera와 Udemy가 가장 일반적으로 사용됩니다.
데이터 과학과 머신 러닝은 빠르게 변화하고 있으므로 응답자의 90% 이상이 계속해서 학습할 예정입니다. 이들 중 약 30%는 전통적인 고등교육 과정을 선택했고, 그보다 더 많은 학생이 온라인 리소스를 통해 공부했습니다.
이 조사에서는가장 흔한 학습 플랫폼으로는 Coursera, Udemy, Kaggle Learn이 있습니다.

프로그래밍 경험: 대부분은 수년간의 프로그래밍 경험을 가지고 있습니다.
응답자 중,대부분의 데이터 과학자는 최소한 몇 년간의 프로그래밍 경험이 있습니다.실제로 8%의 데이터 과학자 중 상당수가 지난 세기, 즉 적어도 20년 전에 프로그래밍을 시작했습니다. 코드를 작성한 적이 없다고 주장하는 데이터 과학자는 2% 미만입니다.
전 세계적으로 보면, 미국의 데이터 과학자들은 훨씬 더 많은 프로그래밍 경험을 가지고 있습니다. 미국에서는 37% 사람들이 10년 이상 프로그래밍에 참여하고 있는 반면, 전 세계적으로는 이 비율이 22%에 불과합니다.

머신 러닝 경험: 대부분은 머신 러닝을 처음 접합니다.
응답자 중,대부분의 데이터 과학자는 머신 러닝을 처음 접합니다.전문 데이터 과학자 중 6% 미만이 10년 이상 머신 러닝을 사용해 왔습니다.

급여 수준: 미국에서 가장 경쟁력 있는 수준
데이터 과학자는 매우 경쟁력 있는 급여를 받습니다.미국의 데이터 과학자는 가장 높은 급여를 받으며, 평균 12만 달러에서 15만 달러(약 78만 위안에서 98만 위안)를 받습니다.
인도에는 많은 데이터 과학자가 있지만, 그들의 수입은 높지 않습니다. 인도 데이터 과학자 중 연봉 5만 달러 미만을 버는 사람은 90%로, 글로벌 데이터 과학자 급여 순위에서 6위에 그쳤습니다.

그들은 어떤 통합 개발 환경을 사용합니까?
보고서에 따르면 JupyterLab IDE는 여전히 데이터 과학자들이 선호하는 도구로, 약 4분의 3의 데이터 과학자가 이를 사용하고 있습니다.하지만 이 숫자는 작년의 83%보다 줄었습니다. Visual Studio Code는 33%보다 약간 앞서 2위를 차지했습니다.

그들은 어떤 머신 러닝 프레임워크를 사용합니까?
파이썬 기반의 머신러닝 라이브러리가 여전히 우세합니다. 안에,Scikit-learn은 대부분 프로젝트에 효과적인 강력한 무기로, 5명 중 4명의 데이터 과학자가 사용하고 있어 1위를 차지했습니다.
설문조사에 따르면 50%의 데이터 과학자는 각각 TensorFlow와 Keras를 사용하고 있습니다.

데이터 과학자가 인기 있는 직책이 되었습니다. 참여하시겠습니까?
Kaggle에서는 2016년부터 매년 이러한 설문 조사를 실시하여 머신 러닝 및 데이터 과학 실무자에 대한 더욱 명확한 입체적 모습과 이 분야의 개발 동향을 파악할 수 있게 되었습니다.
빅데이터 시대에 데이터 과학자에 대한 수요가 폭발적으로 증가했습니다. 동시에 폭넓은 발전 전망과 높은 급여 덕분에 데이터 과학자는 많은 사람의 꿈의 직업이 되었습니다.

하지만 Kaggle의 설문 보고서를 보면 데이터 과학자라는 직업은 점점 더 젊어지고, 교육 수준은 점점 더 높아지고 있는 것을 알 수 있습니다. 따라서 이 분야에 진출하려면 상당한 경쟁에 직면하게 될 것입니다.
Kaggle 보고서:
-- 위에--