HyperAI

صدر تقرير Kaggle السنوي: علماء البيانات شباب وأثرياء، برواتب تقترب من المليون

منذ 4 أعوام
أخبار المصانع الكبيرة
العناوين الرئيسية
神经小兮
特色图像

يقترب عام 2020 من نهايته تدريجيًا، وأصدرت Kaggle تقريرها السنوي للاستطلاع "التعلم الآلي وعلوم البيانات 2020"، والذي يظهر لنا الصورة الجماعية لعلماء البيانات الحاليين.

أجرت Kaggle، وهي منصة مسابقات تحليل البيانات، استطلاعًا مؤخرًا على مستخدمي المنصة، يغطي أبعادًا متعددة مثل المعلومات الأساسية للممارسين، ومستويات الرواتب، وخبرة العمل.

بعد تنظيف بيانات التعليقات الواردة من 20,036 من مستخدمي Kaggle، قام Kaggle أخيرًا بتجميع هذا التقرير لـ 13% (2,675) من المستجيبين. يعمل جميع هؤلاء المستجيبين حاليًا كعلماء بيانات أو في مناصب أخرى تدعم علم البيانات والتعلم الآلي.

استغرق Kaggle شهرًا واحدًا لإكمال تقرير الاستطلاع هذا

حاليًا، تم إصدار أحدث تقرير للتحقيق. ومن خلال هذا التقرير، يمكننا الحصول على نظرة عامة على المشهد الحالي لممارسي التعلم الآلي وعلوم البيانات، بالإضافة إلى حالة التوظيف والاستثمار الرأسمالي للشركات ذات الصلة في هذا المجال، والحصول على لمحة عن أحدث اتجاهات التطوير في الصناعة.

ملاحظة: لا تتضمن هذه الدراسة أي بيانات حول علماء البيانات الصينيين. بعد إجراء بحث، وجد Super Neuro أن Kaggle لديه قاعدة في قواعد المشاركة في الاستطلاع تنص على:

لكي تكون مؤهلاً للحصول على الجوائز في هذا الاستطلاع، يجب عليك:

18 عامًا أو أكبر أو سن المواطنة في البلد الذي تتواجد فيه؛

أنا لست مواطنًا من أرمينيا أو كوبا أو إيران أو سوريا أو كوريا الشمالية أو السودان؛

ليس ممثلاً لأي شخص أو كيان خاضع لضوابط التصدير أو العقوبات الأمريكية.

من الواضح أن الدول وممثلي الكيانات والأفراد المذكورين أعلاه غير مؤهلين للحصول على الجائزة

منذ عام 2018، أدرجت الولايات المتحدة أكثر من 200 شركة صينية و13 جامعة في "قائمة الكيانات" لأغراض مراقبة الصادرات أو العقوبات. لقد قمنا بتجميع قائمة هذه الجامعات وبعض الشركات في مجالات التكنولوجيا والذكاء الاصطناعي على النحو التالي:

مَشرُوع

مركز بكين لأبحاث علوم الحوسبة، مركز بكين للحوسبة السحابية، SMIC، Dahua Technology، Hikvision، iFlytek، Megvii Technology، SenseTime، Yitu Technology، CloudWalk Technology، Intellifusion Technologies Co.، Ltd.، NetPosa Technology Co.، Ltd.، Beijing CloudMinds، Qihoo 360 Technology Co.، Ltd.، Xiamen Meiya Pico Information Co.، Ltd.، Yixin Technology، 38 شركة تابعة لشركة Huawei، المعهد الثلاثين لشركة China Electronics Technology Group Corporation، المعهد السابع لشركة China Electronics Technology Group Corporation، ومعهد Wuxi Jiangnan لتكنولوجيا الحوسبة.

الكليات والجامعات

جامعة بكين للملاحة الجوية والفضائية، جامعة الشعب الصينية، الجامعة الوطنية لتكنولوجيا الدفاع، جامعة هونان، معهد هاربين للتكنولوجيا، جامعة هاربين للهندسة، جامعة نورث وسترن للتكنولوجيا، جامعة شيآن جياوتونغ، جامعة العلوم والتكنولوجيا الإلكترونية في الصين، جامعة سيتشوان، جامعة تونغجي، جامعة قوانغدونغ للتكنولوجيا، وجامعة نانتشانغ.

بمعنى آخر، طالما أن مدرستك أو شركتك مدرجة في قائمة الكيانات، فيمكنك ملء الاستبيان، ولكن لا يمكنك المشاركة في تقييم الجائزة. ورغم عدم إجراء أي فحص أو بيان إضافي للخلفية، فقد رفض كاجل على وجه التحديد وبشكل محدد مشاركة العديد من الصينيين.

النسخة الموجزة للتقرير: صورة جماعية لعلماء البيانات

التوزيع حسب الجنس والعمر والتعليم 

  • يعمل في هذا المجال عدد أكبر من الرجال مقارنة بالنساء، حيث تصل نسبة الذكور إلى الإناث إلى حوالي 5:1.
  • 35 عامًا هو نقطة تحول، فمعظم المستجيبين أصغر من 35 عامًا
  • أكثر من نصف المستجيبين يحملون درجة الدراسات العليا

التعليم وخبرة العمل 

  • يواصل معظم علماء البيانات تعلم التقنيات الجديدة بعد التخرج
  • لدى معظم علماء البيانات خبرة في البرمجة تقل عن 10 سنوات
  • أكثر من نصف علماء البيانات لديهم أقل من ثلاث سنوات من الخبرة في التعلم الآلي
  • يكسب علماء البيانات الذين يعيشون في الولايات المتحدة رواتب أعلى بكثير من نظرائهم في البلدان الأخرى.

المسوحات المتعلقة بالتكنولوجيا 

  • يستخدم عدد أكبر من علماء البيانات الحوسبة السحابية مقارنة بعام 2019
  • Scikit-Learn هي أداة التعلم الآلي الأكثر استخدامًا، والتي يستخدمها 4 من 5 علماء البيانات
  • Tableau و PowerBI هما أدوات الاستخبارات التجارية الأكثر شيوعًا

تهيمن الهند على القائمة، حيث يتكون سكانها في الغالب من الذكور، مع متوسط درجة الماجستير للفرد الواحد.

الجنس: أكثر من 80% من الذكور 

لا يزال هناك خلل كبير بين الجنسين بين علماء البيانات، حيث أن أكثر من 80٪ منهم من الرجال.

أظهر مسح العام الماضي أن 84% كانوا من الذكور، وهذا العام تغيرت النسبة قليلاً

العمر: انضم عدد كبير من الأشخاص المولودين بعد عام 1995 

يتراوح عمر علماء البيانات عادةً بين العشرينات أو أوائل الثلاثينيات، ويتراوح بين 22 إلى 34 عامًا.واحد فقط من كل خمسة علماء بيانات محترفين يزيد عمره عن 40 عامًا.

علماء البيانات تتراوح أعمارهم بين 25 و 34 عامًا

هناك دلائل تشير إلى أن علماء البيانات أصبحوا أصغر سناً مع تزايد مشاركة "الجيل Z"، حيث أصبح ما يقرب من 7% من علماء البيانات تتراوح أعمارهم الآن بين 18 و21 عاماً.

وهذه زيادة مقارنة بـ 5% في العام الماضي، لذا فمن المتوقع أن تصبح هذه المجموعة أصغر سنا وأصغر سنا في المستقبل.

الدولة: الهند والولايات المتحدة على رأس القائمة 

ومن بين علماء البيانات الذين شاركوا في المسح السنوي لشركة Kaggle، شكل علماء البيانات الهنود 22%، في حين شكل علماء البيانات في الولايات المتحدة 14.5%، وكلاهما يتفوقان بشكل كبير على البرازيل، التي احتلت المرتبة الثالثة (أقل من 5%).

ولم يتضمن التقرير الصين صراحة بسبب عوامل مختلفة، ولكن عدد الآخرين الذين احتلوا المرتبة الثالثة ليس منخفضا، ربما لأنه يهدف إلى تضمين المستخدمين الصينيين في النتائج الإحصائية الصحيحة.

تتمتع الهند والولايات المتحدة بميزة واضحة في عدد علماء البيانات

التعليم: درجة الدراسات العليا هي المعيار 

ويظهر الاستطلاع أنه، كما في السنوات السابقة، لا تزال الدرجة العلمية العليا هي القاعدة بالنسبة لعلماء البيانات.أكثر من علماء البيانات في 68% يحملون درجة الماجستير أو الدكتوراه.أقل من 5% من علماء البيانات ليس لديهم تعليم أعلى من المدرسة الثانوية.

أكثر من نصف علماء البيانات حاصلون على درجة الماجستير

  منصات التعلم: Coursera و Udemy هما الأكثر استخدامًا 

يتغير علم البيانات والتعلم الآلي بسرعة، لذا فإن أكثر من 90% من المشاركين سيستمرون في التعلم. ومن بين هؤلاء، اختار حوالي 30% دورات التعليم العالي التقليدية، في حين درس عدد أكبر من خلال الموارد عبر الإنترنت.

في هذا الاستطلاع،Coursera و Udemy و Kaggle Learn هي منصات التعلم الأكثر شيوعًا.

يتعلم الكثير من الناس على أكثر من منصة،وأظهر الاستطلاع أنهم يختارون 2.8 منصة للشخص الواحد.

خبرة البرمجة: معظمهم لديهم سنوات عديدة من الخبرة في البرمجة 

ومن بين المستجيبين،لدى معظم علماء البيانات خبرة في البرمجة لعدة سنوات على الأقل.في الواقع، بدأ أكثر من 8% علماء البيانات في البرمجة في القرن الماضي، أي منذ 20 عامًا على الأقل. يزعم أقل من 2% من علماء البيانات أنهم لم يكتبوا أي تعليمات برمجية على الإطلاق.

على الصعيد العالمي، يتمتع علماء البيانات الأمريكيون بخبرة أكبر في البرمجة. في الولايات المتحدة، انخرط 37% من الأشخاص في البرمجة لأكثر من 10 سنوات، بينما على مستوى العالم، تبلغ هذه النسبة 22% فقط.

تعتبر الخبرة في البرمجة مهمة لعلماء البيانات

تجربة التعلم الآلي: معظمهم جدد في مجال التعلم الآلي 

ومن بين المستجيبين،معظم علماء البيانات جدد في مجال التعلم الآلي.أقل من 6% من علماء البيانات المحترفين يستخدمون التعلم الآلي لمدة 10 سنوات أو أكثر.

أكثر من نصف علماء البيانات،أقل من ثلاث سنوات من الخبرة في التعلم الآلي

مستوى الراتب: الأكثر تنافسية في الولايات المتحدة 

يحصل علماء البيانات على راتب تنافسي للغاية.يتمتع علماء البيانات في الولايات المتحدة بأعلى الرواتب، بمتوسط يتراوح بين 120 ألف دولار إلى 150 ألف دولار (أي ما يعادل حوالي 780 ألف يوان صيني إلى 980 ألف يوان صيني).

على الرغم من أن الهند لديها عدد كبير من علماء البيانات، إلا أن دخلهم ليس مرتفعًا. يبلغ دخل علماء البيانات الهنود أقل من 50 ألف دولار سنويًا، ويحتلون المرتبة السادسة فقط في تصنيف رواتب علماء البيانات العالمي.

متوسط رواتب علماء البيانات حول العالم

ما هي بيئات التطوير المتكاملة التي يستخدمونها؟

يوضح التقرير أن JupyterLab IDE يظل الأداة المفضلة لعلماء البيانات، حيث يستخدمه حوالي ثلاثة أرباع علماء البيانات.ومع ذلك، فإن هذا العدد أقل من 83% في العام الماضي. حصل Visual Studio Code على المركز الثاني، متقدمًا بفارق ضئيل على 33%.

  ما هي أطر التعلم الآلي التي يستخدمونها؟

لا تزال مكتبات التعلم الآلي المعتمدة على Python تهيمن. في،Scikit-learn هو سلاح خارق يعمل في معظم المشاريع ويحتل المرتبة الأولى، حيث يستخدمه 4 من أصل 5 علماء بيانات.

في الاستطلاع، يستخدم علماء البيانات 50% TensorFlow وKeras على التوالي.

ومن بينها، احتلت Xgboost التي أنشأها الدكتور تشين تيانكي في الصين المرتبة الرابعة.

لقد أصبح عالم البيانات منصبًا ساخنًا. هل تريد الانضمام إليها؟

منذ عام 2016، أجرت Kaggle مثل هذا الاستطلاع كل عام، مما يسمح لنا برؤية صورة ثلاثية الأبعاد أكثر وضوحًا لممارسي التعلم الآلي وعلوم البيانات، بالإضافة إلى اتجاهات التطوير في هذا المجال.

في عصر البيانات الضخمة، ازداد الطلب على علماء البيانات بشكل كبير. وفي الوقت نفسه، فإن آفاق التطوير الواسعة والرواتب السخية تجعل من علماء البيانات مهنة حلم بالنسبة للعديد من الناس.

وفقًا لاتجاهات Google، في العقد الماضي،تزايد الاهتمام بأدوار علماء البيانات

ومع ذلك، من تقرير استطلاع Kaggle، يمكننا أن نرى أن مهنة عالم البيانات أصبحت أصغر وأصغر سنا، وأصبح مستوى تعليمهم أعلى وأعلى. لذلك، إذا كنت ترغب في الانضمام إلى هذا المسار، فسوف تواجه منافسة كبيرة.

تقرير كاجل:

https://storage.googleapis.com/kaggle-media/surveys/Kaggle%20State%20of%20Machine%20Learning%20and%20Data%20Science%202020.pdf

-- زيادة--