Kaggle 年次報告書が発表: データサイエンティストは若くて裕福で、給与は 100 万近く

2020年も徐々に終わりに近づいていますが、Kaggleは現在のデータサイエンティストグループの姿を示す年次調査レポート「機械学習とデータサイエンス2020」を発表しました。
データ分析コンペティションプラットフォームである Kaggle は最近、プラットホームユーザーを対象に、実務者の基本情報、給与レベル、職歴などの側面を対象としたアンケートを実施しました。
20,036 人の Kaggle ユーザーからのフィードバックに基づいてデータを整理した後、kaggle は最終的に 13% (2675) 人の回答者を対象にこのレポートを編集しました。これらの回答者は全員、データ サイエンティストまたはデータ サイエンスと機械学習をサポートするその他の職に就いています。

現在、最新の調査報告書が公表されています。このレポートからは、機械学習やデータサイエンスの実務者の現状、関連企業の人材雇用や設備投資の状況を知ることができ、業界の最新の発展動向を垣間見ることができます。 。
注: この調査には、中国のデータサイエンティストに関連するデータはありません。調査の結果、Kaggle アンケートの参加ルールの 1 つが次のようになっていることがわかりました。
このアンケートで賞を受賞するには、次の条件を満たす必要があります。
18 歳以上、または居住国が指定する市民権年齢以上。
私はアルメニア、キューバ、イラン、シリア、北朝鮮、スーダンの国民ではありません。
米国の輸出規制または制裁の対象となる個人または団体の代表者ではありません。

2018年以来、米国は輸出管理または制裁の「エンティティリスト」に200社以上の中国企業と13の大学を含めており、これらの大学とテクノロジーおよび人工知能分野の一部企業のリストを以下のようにまとめた。
企業
北京計算科学研究センター、北京クラウドコンピューティングセンター、SMIC、ダーファテクノロジー、Hikvision、iFlytek、Megvii Technology、SenseTime、Yitu Technology、Yuncong Technology、Yuntian Lifei Technology Co., Ltd.、Oriental Netpower Technology Co., Ltd.、北京CloudMinds Technology Co., Ltd.、Qihoo 360 Technology Co., Ltd.、Xiamen Meiya Beko Information Co., Ltd.、Yixin Technology、ファーウェイの子会社 38 社、中国電子技術集団有限公司、中国電子技術集団有限公司第 30 研究所無錫江南計算技術研究院研究院。
カレッジ
北京航空航天大学、中国人民大学、国立国防技術大学、湖南大学、ハルビン工業大学、ハルビン工程大学、西北理工大学、西安交通大学、中国電子科学技術大学、四川省大学、同済大学、広東理工大学、南昌大学。
つまり、あなたの学校や企業が Entity List に掲載されている限り、アンケートに記入することはできますが、賞の評価には参加できません。それ以上の身元調査や声明はなかったが、Kaggle は多くの中国人の参加を名指しで拒否した。
レポートの改良版: データ サイエンティストのグループ ポートレート
性別、年齢、学歴分布
- この分野では女性よりも男性の方が多く、男女比は約5:1です。
- 35 歳が分岐点であり、回答者のほとんどは 35 歳未満です
- 回答者の半数以上が大学院の学位を取得しています
学歴と職歴
- ほとんどのデータサイエンティストは学校を卒業した後も新しいテクノロジーを学び続けます
- ほとんどのデータ サイエンティストのプログラミング経験は 10 年未満です
- データサイエンティストの半数以上は機械学習の経験が 3 年未満です
- 米国に住むデータサイエンティストは、他の国のデータサイエンティストよりもはるかに多くの収入を得ています。
テクノロジー関連調査
- 2019 年よりも多くのデータ サイエンティストがクラウド コンピューティングを使用しています
- Scikit-Learn は最も使用されている機械学習ツールであり、データ サイエンティストの 4 ~ 5 人が使用しています
- Tableau と PowerBI は最も人気のあるビジネス インテリジェンス ツールです
主に男性、一人当たりの修士号取得者数、インドがリストを独占
性別:スーパーエイトが男性になる
データサイエンティストの従事者の間には依然として男女間の大きな不均衡があり、その80%以上が男性です。

年齢: 95 歳 95 年以降に軍が加わった
データ サイエンティストは通常 20 代から 30 代前半で、約 60% は 22 ~ 34 歳です。プロのデータ サイエンティストの 5 人に 1 人だけが 40 歳以上です。

データサイエンティストのほとんどは25歳から34歳の間です
Z 世代 (およそ 1995 年から 2005 年に生まれた世代) の関与が高まるにつれ、データ サイエンティストが若年化している兆しがあり、現在 7% 近くのデータ サイエンティストが 18 歳から 21 歳になっています。
昨年の5%と比べても増加傾向にあり、今後ますます若年化が進むことが予想されます。
国: インドと米国が上位 2 位を独占
この Kaggle 年次調査に参加したデータ サイエンティストのうち、インドのデータ サイエンティストは 22% を占め、米国のデータ サイエンティストは 14.5% を占め、どちらも 3 位のブラジル (5% 未満) を大きく上回りました。
このレポートにはさまざまな要因により中国は明示的に含まれていませんでしたが、おそらく有効な統計結果に中国人ユーザーを含めるために、3 位にランクされた「その他」の数は少なくありません。

教育: 大学院の学位が標準です
この調査では、これまでと同様に、データサイエンティストにとって大学院の学位が依然として標準であることが示されています。68% を超えるデータ サイエンティストが修士号または博士号を取得しています。5% 未満のデータ サイエンティストは高校以上の学位を持っていません。

学習プラットフォーム: Coursera と Udemy が最も一般的に使用されています
データ サイエンスと機械学習は急速に変化しているため、調査対象者の 90% 以上が今後も学習を続けると考えられます。このうち、約 30% は従来の高等教育コースを選択し、さらに多くはオンライン リソースを通じて学習しました。
今回の調査では、Coursera、Udemy、Kaggle Learn は最も一般的な学習プラットフォームです。

プログラミング経験: ほとんどが長年のプログラミング経験を持っています
回答者の中には、ほとんどのデータ サイエンティストは少なくとも数年のプログラミング経験があります。実際、8% を超えるデータ サイエンティストが前世紀、つまり少なくとも 20 年前からプログラミングを行っています。 2% 未満のデータ サイエンティストは、コードを書いたことがないと主張しています。
世界的に見て、アメリカのデータサイエンティストははるかに多くのプログラミング経験を持っています。米国では、10 年以上プログラミングに携わっている人は 37% ですが、世界全体では、この割合はわずか 22% です。

機械学習の経験: ほとんどが機械学習の初心者です
回答者の中には、ほとんどのデータ サイエンティストは機械学習の初心者です。10 年以上機械学習を使用しているプロのデータ サイエンティストは 6% 未満です。

給与水準: 米国で最も競争力のある水準
データサイエンティストの給与は非常に競争力があります。米国のデータサイエンティストの給与が最も高く、平均給与は12万~15万米ドル(約78万~98万人民元)です。
インドには多数のデータサイエンティストがいますが、その収入は高くありません。ほぼ 90% インドのデータサイエンティストの年収は 50,000 米ドル未満であり、世界のデータサイエンティストの給与ランキングでは 6 位にすぎません。

彼らはどのような統合開発環境を使用していますか?
レポートによると、JupyterLab IDE は依然としてデータ サイエンティストにとって最適なツールであり、データ サイエンティストの約 4 分の 3 がそれを使用しています。ただし、この数字は昨年の83%よりも減少しています。 Visual Studio Code は 33% のすぐ上で 2 位にランクされています。

彼らはどのような機械学習フレームワークを使用していますか?
Python ベースの機械学習ライブラリは依然として主流です。で、Scikit-learn は、ほとんどのプロジェクトで機能する超兵器であり、データ サイエンティストの 5 人中 4 人が使用して第 1 位にランクされています。
調査中、50% データ サイエンティストは TensorFlow と Keras をそれぞれ使用しました。

データ サイエンティストは注目の職業になっています。参加してみませんか?
2016 年以来、kaggle はこのような調査を毎年実施しており、これにより、機械学習およびデータ サイエンスの実践者の 3 次元像と、この分野の開発傾向をより明確に把握できるようになりました。
ビッグデータの時代において、企業におけるデータサイエンティストの需要は爆発的に増加しました。同時に、幅広い発展の可能性と高額な給与により、データ サイエンティストは多くの人にとって夢の職業となっています。

しかし、Kaggle の調査レポートから、データサイエンティストという職業はますます若年化しており、彼らの教育レベルはますます高くなっていることがわかります。したがって、このトラックに参加したい場合、直面する競争は小さくありません。
カグルレポート:
- 以上 -