Der Jahresbericht Von Kaggle Ist Erschienen: Datenwissenschaftler Sind Jung Und Wohlhabend, Mit Gehältern Von Fast Einer Million

Das Jahr 2020 neigt sich langsam dem Ende zu und Kaggle hat seinen jährlichen Umfragebericht „Maschinelles Lernen und Datenwissenschaft 2020“ veröffentlicht, der uns das Gruppenporträt der aktuellen Datenwissenschaftler zeigt.
Kaggle, eine Wettbewerbsplattform für Datenanalyse, hat kürzlich eine Umfrage unter Plattformbenutzern durchgeführt, die mehrere Dimensionen abdeckte, wie etwa grundlegende Informationen zu Praktikern, Gehaltsniveaus und Berufserfahrung.
Nach der Datenbereinigung des Feedbacks von 20.036 Kaggle-Benutzern hat Kaggle schließlich diesen Bericht für 13% (2.675) Befragte zusammengestellt. Diese Befragten sind alle derzeit als Datenwissenschaftler oder in anderen Positionen beschäftigt, die Datenwissenschaft und maschinelles Lernen unterstützen.

Aktuell liegt der neueste Untersuchungsbericht vor. Dieser Bericht verschafft uns einen Überblick über die aktuelle Landschaft der Praktiker im Bereich des maschinellen Lernens und der Datenwissenschaft sowie über den Beschäftigungs- und Kapitalinvestitionsstatus der entsprechenden Unternehmen in diesem Bereich und bietet einen Einblick in die neuesten Entwicklungstrends in der Branche.
Hinweis: In dieser Umfrage gibt es keine Daten zu chinesischen Datenwissenschaftlern. Nach Recherchen fand Super Neuro heraus, dass die Teilnahmeregeln für Umfragen bei Kaggle eine Regel enthalten, die lautet:
Um für die Preise dieser Umfrage berechtigt zu sein, müssen Sie:
18 Jahre oder älter oder das Staatsbürgerschaftsalter des Landes, in dem Sie sich befinden;
Ich bin kein Staatsbürger Armeniens, Kubas, Irans, Syriens, Nordkoreas oder des Sudans.
Kein Vertreter einer Person oder Organisation, die US-amerikanischen Exportkontrollen oder Sanktionen unterliegt.

Seit 2018 haben die USA mehr als 200 chinesische Unternehmen und 13 Universitäten auf die „Entity List“ gesetzt, um Exportkontrollen oder Sanktionen gegen sie zu verhängen. Die Liste dieser Universitäten und einiger Unternehmen aus den Bereichen Technologie und künstliche Intelligenz haben wir wie folgt zusammengestellt:
Unternehmen
Beijing Computational Science Research Center, Beijing Cloud Computing Center, SMIC, Dahua Technology, Hikvision, iFlytek, Megvii Technology, SenseTime, Yitu Technology, CloudWalk Technology, Intellifusion Technologies Co., Ltd., NetPosa Technology Co., Ltd., Beijing CloudMinds, Qihoo 360 Technology Co., Ltd., Xiamen Meiya Pico Information Co., Ltd., Yixin Technology, 38 Huawei-Tochtergesellschaften, das 30. Institute of China Electronics Technology Group Corporation, das 7. Institute of China Electronics Technology Group Corporation und das Wuxi Jiangnan Institute of Computing Technology.
Hochschulen und Universitäten
Universität für Luft- und Raumfahrt Peking, Renmin-Universität China, Nationale Universität für Verteidigungstechnologie, Hunan-Universität, Harbin Institute of Technology, Harbin Engineering University, Northwestern Polytechnical University, Xi'an Jiaotong University, Universität für Elektronikwissenschaft und -technologie Chinas, Sichuan-Universität, Tongji-Universität, Technische Universität Guangdong und Nanchang-Universität.
Mit anderen Worten: Solange Ihre Schule oder Ihr Unternehmen auf der Entity List steht, können Sie den Fragebogen ausfüllen, aber nicht an der Preisauswertung teilnehmen. Obwohl es keine weitere Hintergrundprüfung oder Stellungnahme gab, lehnte Kaggle die Teilnahme vieler Chinesen ausdrücklich und gezielt ab.
Bericht Kurzfassung: Gruppenporträt der Data Scientists
Geschlechts-, Alters- und Bildungsverteilung
- In diesem Bereich arbeiten mehr Männer als Frauen; das Verhältnis beträgt etwa 5:1.
- 35 Jahre ist ein Wendepunkt, die meisten Befragten sind jünger als 35 Jahre
- Mehr als die Hälfte der Befragten verfügt über einen postgradualen Abschluss
Ausbildung und Berufserfahrung
- Die meisten Datenwissenschaftler lernen nach dem Abschluss weiterhin neue Technologien
- Die meisten Datenwissenschaftler programmieren seit weniger als 10 Jahren
- Mehr als die Hälfte der Datenwissenschaftler haben weniger als drei Jahre Erfahrung im maschinellen Lernen
- In den USA lebende Datenwissenschaftler verdienen deutlich mehr als ihre Kollegen in anderen Ländern.
Technologiebezogene Umfragen
- Mehr Datenwissenschaftler nutzen Cloud Computing als 2019
- Scikit-Learn ist das am häufigsten verwendete Tool für maschinelles Lernen und wird von 4/5 Datenwissenschaftlern verwendet.
- Tableau und PowerBI sind die beliebtesten Business-Intelligence-Tools
Indien ist überwiegend männlich und hat einen Master-Abschluss pro Kopf.
Geschlecht: Mehr als 80 % sind männlich
Unter den Datenwissenschaftlern besteht immer noch ein großes Ungleichgewicht zwischen den Geschlechtern: Mehr als 80 % sind Männer.

Alter: Post-95-Jährige sind beigetreten
Datenwissenschaftler sind im Allgemeinen in ihren Zwanzigern oder frühen Dreißigern, das Alter liegt zwischen 22 und 34 Jahren.Nur jeder fünfte professionelle Datenwissenschaftler ist über 40 Jahre alt.

Data Scientists sind zwischen 25 und 34 Jahre alt
Es gibt Anzeichen dafür, dass Datenwissenschaftler jünger werden, da die „Generation Z“ stärker involviert ist; fast 71 % der Datenwissenschaftler von TP3T sind mittlerweile zwischen 18 und 21 Jahre alt.
Dies ist ein Anstieg im Vergleich zum Vorjahr (5%), sodass absehbar ist, dass diese Gruppe in Zukunft immer jünger wird.
Land: Indien und die USA führen die Liste an
Unter den Datenwissenschaftlern, die an der jährlichen Umfrage von Kaggle teilnahmen, entfielen 221 TP3T auf indische Datenwissenschaftler, während 14,51 TP3T auf die USA entfielen. Damit lagen beide Datenwissenschaftler weit vor Brasilien, das auf Platz drei lag (weniger als 51 TP3T).
Aufgrund verschiedener Faktoren wurde China im Bericht nicht explizit berücksichtigt, die Anzahl der anderen Nutzer auf Platz 3 ist jedoch nicht gering, möglicherweise weil die Absicht besteht, chinesische Nutzer in die gültigen statistischen Ergebnisse einzubeziehen.

Ausbildung: Hochschulabschluss ist Standard
Die Umfrage zeigt, dass für Datenwissenschaftler wie in den Vorjahren ein Hochschulabschluss die Norm bleibt.Mehr als 681 der Datenwissenschaftler von TP3T verfügen über einen Master- oder Doktortitel.Weniger als 51 der Datenwissenschaftler von TP3T verfügen über keinen höheren Schulabschluss als den High School-Abschluss.

Lernplattformen: Coursera und Udemy werden am häufigsten genutzt
Datenwissenschaft und maschinelles Lernen verändern sich rasant, sodass über 90 % der Befragten weiterhin lernen werden. Davon entschieden sich etwa 30% für traditionelle Hochschulkurse, während viele weitere über Online-Ressourcen studierten.
In dieser UmfrageCoursera, Udemy und Kaggle Learn sind die gängigsten Lernplattformen.

Programmiererfahrung: Die meisten verfügen über langjährige Programmiererfahrung
Unter den BefragtenDie meisten Datenwissenschaftler verfügen über mindestens einige Jahre Programmiererfahrung.Tatsächlich haben mehr als 81 der Datenwissenschaftler von TP3T im letzten Jahrhundert, also vor mindestens 20 Jahren, mit dem Programmieren begonnen. Weniger als 2%-Datenwissenschaftler geben an, noch nie Code geschrieben zu haben.
Weltweit verfügen amerikanische Datenwissenschaftler über wesentlich mehr Programmiererfahrung. In den Vereinigten Staaten sind 37% Menschen seit mehr als 10 Jahren in der Programmierung tätig, während dieser Anteil weltweit nur 22% beträgt.

Erfahrung mit maschinellem Lernen: Die meisten sind neu im Bereich maschinelles Lernen
Unter den BefragtenFür die meisten Datenwissenschaftler ist maschinelles Lernen neu.Weniger als 61 % der professionellen Datenwissenschaftler nutzen maschinelles Lernen seit 10 Jahren oder länger.

Gehaltsniveau: Das wettbewerbsfähigste in den Vereinigten Staaten
Datenwissenschaftler verdienen ein sehr wettbewerbsfähiges Gehalt.Datenwissenschaftler erhalten in den USA die höchsten Gehälter, durchschnittlich 120.000 bis 150.000 US-Dollar (ungefähr 780.000 bis 980.000 RMB).
Obwohl es in Indien eine große Zahl von Datenwissenschaftlern gibt, ist ihr Einkommen nicht hoch. Fast 901.000 indische Datenwissenschaftler verdienen weniger als 50.000 US-Dollar pro Jahr und belegen damit im weltweiten Gehaltsranking für Datenwissenschaftler nur den sechsten Platz.

Welche integrierten Entwicklungsumgebungen verwenden sie?
Der Bericht zeigt, dass JupyterLab IDE weiterhin das bevorzugte Tool für Datenwissenschaftler ist und von etwa drei Vierteln der Datenwissenschaftler verwendet wird.Allerdings ist diese Zahl niedriger als die 83% des Vorjahres. Visual Studio Code belegte den zweiten Platz, knapp vor 33%.

Welche Frameworks für maschinelles Lernen verwenden sie?
Auf Python basierende Bibliotheken für maschinelles Lernen dominieren noch immer. In,Scikit-learn ist eine Superwaffe, die für die meisten Projekte geeignet ist und mit 4 von 5 Datenwissenschaftlern, die es verwenden, auf Platz 1 steht.
In der Umfrage werden TensorFlow und Keras von 50%-Datenwissenschaftlern verwendet.

Datenwissenschaftler sind zu einer gefragten Position geworden. Willst du mitmachen?
Seit 2016 führt Kaggle jedes Jahr eine solche Umfrage durch, die es uns ermöglicht, ein klareres dreidimensionales Bild der Praktiker des maschinellen Lernens und der Datenwissenschaft sowie der Entwicklungstrends in diesem Bereich zu erhalten.
Im Zeitalter von Big Data ist die Nachfrage nach Datenwissenschaftlern explosionsartig gestiegen. Gleichzeitig machen breite Entwicklungsmöglichkeiten und großzügige Gehälter den Beruf des Data Scientists für viele Menschen zu einem Traumberuf.

Aus dem Umfragebericht von Kaggle geht jedoch hervor, dass der Beruf des Datenwissenschaftlers immer jünger wird und sein Bildungsniveau immer höher wird. Wenn Sie sich diesem Weg anschließen möchten, müssen Sie daher mit erheblicher Konkurrenz rechnen.
Kaggle-Bericht:
-- über--