9 مجموعات بيانات للتعلم الآلي لا يمكنك تفويتها

نظرة عامة على المحتوى: ينظم هذا العدد 9 مجموعات بيانات تم تحديثها مؤخرًا بواسطة الموقع الرسمي لشركة HyperAI، وتغطي ثلاثة مجالات: التعرف على الوجه، وتقدير الموقف، والقيادة الذاتية.
الكلمات المفتاحية: التعرف على الوجه، تقدير الوضعية، القيادة الذاتية
تم نشر هذه المقالة لأول مرة على الحساب الرسمي لـ WeChat:هايبر ايه اي
في الآونة الأخيرة، قام الموقع الرسمي لشركة HyperAI بتحديث أكثر من 300 مجموعة بيانات عامة عالية الجودة، تغطي نماذج البيانات مثل الصور ومقاطع الفيديو والصوت وRGB-D وما إلى ذلك.
تلخص هذه المقالة 9 مجموعات بيانات تمثيلية يمكنك تنزيلها واستخدامها حسب الحاجة.
الوصول المباشر إلى بوابة بيانات HyperAI Hyper Neural:

التعرف على الوجه
يعد التعرف على الوجه أحد تطبيقات مشاريع الرؤية الحاسوبية. في تدريب التعرف على الوجه،تتميز بيانات التدريب بحجمها الكبير وجودتها المستقرة وخالية من "الشوائب"، مما يجعلها قاعدة بيانات عالية الجودة جدًا للأبحاث.
مجموعة بيانات التعرف على الوجه VGG-Face2
مجموعة البيانات VGG-Face2 عبارة عن مجموعة بيانات لصور الوجه.
الصور الموجودة في مجموعة البيانات كلها من بحث الصور على Google. يختلف الأشخاص في مجموعة البيانات بشكل كبير من حيث الوضعية والعمر والعرق والمهنة.
مجموعة بيانات VGG-Face2
وكالة النشر: جامعة أكسفورد
الكمية المتضمنة: 3.31 مليون صورة
تنسيق البيانات: الصور
حجم البيانات: 37.49 جيجابايت
وقت الإصدار: 2017
عنوان التنزيل:hyper.ai/datasets/5711
مجموعة بيانات وجه هيلين
تتكون مجموعة بيانات HELEN من 2330 صورة وجه بحجم 400 × 400 بكسل. تتكون مجموعة البيانات من 2000 صورة تدريبية و 330 صورة اختبار.مع تعليقات دقيقة للغاية ومفصلة ومتسقة للمكونات الرئيسية للوجوه.
مجموعة بيانات هيلين
وكالة النشر: جامعة إلينوي
الكمية المتضمنة: 2,330 صورة وجه بدقة 400*400 بكسل
تنسيق البيانات: الصور
حجم البيانات: 1.02 جيجابايت
وقت الإصدار: 2012
عنوان التنزيل:hyper.ai/datasets/16552
مجموعة بيانات وجه FairFace
FairFace هي مجموعة بيانات لصور الوجوه أكثر توازناً من الناحية العنصرية. تحتوي مجموعة البيانات على 108,501 صورة من 7 مجموعات عرقية مختلفة (الأبيض، الأسود، الهندي، شرق الآسيوي، جنوب شرق آسيا، الشرق الأوسط، واللاتينيين).
مجموعة بيانات فيرفيس
وكالة النشر: جامعة كاليفورنيا، لوس أنجلوس
الكمية المتضمنة: 108,501 صورة
تنسيق البيانات: الصور
حجم البيانات: 2.49 جيجابايت
وقت الإصدار: 2020
عنوان التنزيل: hyper.ai/datasets/17876
تقدير وضعية الإنسان
يستخدم تقدير الوضع بعض النماذج أو الهياكل الهندسية لتمثيل بنية وشكل الكائن. تشمل الصعوبات الحالية الخلفية المعقدة وعينات قليلة من المواقف المعقدة.
مجموعة بيانات تقدير وضعية الإنسان ثلاثية الأبعاد MPI-INF-3DHP
MPI-INF-3DHP عبارة عن مجموعة بيانات ثلاثية الأبعاد لتقدير وضعية الإنسان مع صور في البيئات الداخلية والخارجية. تحتوي مجموعة البيانات على أكثر من 1.3 مليون صورة، تسجل 8 أنواع من أنشطة 8 مشاركين من 14 زاوية كاميرا.
مجموعة بيانات MPI-INF-3DHP
وكالة النشر: جامعة سارلاند
الكمية المتضمنة: أكثر من 1.3 مليون صورة
تنسيق البيانات: فيديو
حجم البيانات: 21.77 جيجابايت
وقت الإصدار: 2016
عنوان التنزيل:hyper.ai/datasets/17262
مجموعة بيانات وضعية اليد HandNet
تحتوي مجموعة بيانات وضع اليد HandNet على خرائط عمق لأيدي 10 مشاركين مشوهة بشكل غير صلب أمام كاميرا RealSense RGB-D. تحتوي مجموعة البيانات على إجمالي 214,971 خريطة عمق، بما في ذلك 202,198 مجموعة تدريب، و10,000 مجموعة اختبار، و2,773 مجموعة تحقق.
مجموعة بيانات HandNet
وكالة النشر: معهد إسرائيل للتكنولوجيا - التخنيون
الكمية المتضمنة: 214,971 صورة
تنسيق البيانات: الصور
حجم البيانات: 12.85 جيجابايت
وقت الإصدار: 2015
عنوان التنزيل:hyper.ai/datasets/19801
مجموعة بيانات وضعية 3DPW
3DPW تعني 3D Poses in the Wild.إنها أول مجموعة بيانات خارجية تحتوي على أوضاع ثلاثية الأبعاد دقيقة ويمكن استخدامها لحل مشكلة تقدير الوضع. تتضمن مجموعة البيانات 60 تسلسل فيديو، ومسحًا بشريًا ثلاثي الأبعاد، ونماذج بشرية ثلاثية الأبعاد.
مجموعة بيانات 3DPW
وكالة النشر: جامعة لايبنيز هانوفر
الكمية المتضمنة: 60 تسلسل فيديو
تنسيق البيانات: فيديو
حجم البيانات: 4.55 جيجابايت
وقت الإصدار: 2018
عنوان التنزيل: hyper.ai/datasets/16463
القيادة الذاتية
يمكن للذكاء الاصطناعي أن يلعب دور السائق في القيادة الذاتية.من خلال جمع وتحليل ومعالجة المعلومات حول الظروف المختلفة التي تحدث على الطريق، يتم تنفيذ العمليات لتحل محل التحكم البشري.
مجموعة بيانات فيديو القيادة الذاتية Comma.ai
مجموعة بيانات Comma.ai عبارة عن مجموعة بيانات فيديو للقيادة الذاتية. تحتوي مجموعة البيانات على إجمالي 7.25 ساعة من الفيديو، وتحتوي على 10 مقاطع فيديو مسجلة بتردد 20 هرتز. تتضمن مجموعة البيانات أيضًا قياسات مثل سرعة السيارة، والتسارع، وزاوية التوجيه، وإحداثيات نظام تحديد المواقع العالمي (GPS)، وزاوية الجيروسكوب، وما إلى ذلك.
مجموعة بيانات Comma.ai
وكالة النشر: كوما.اي
الكمية المتضمنة: 7.25 ساعة من الفيديو
تنسيق البيانات: فيديو
حجم البيانات: 44.96 جيجابايت
وقت الإصدار: 2016
عنوان التنزيل: hyper.ai/datasets/5200
مجموعة بيانات القيادة الذاتية Argoverse
تتكون مجموعة بيانات Argoverse من جزأين: التتبع ثلاثي الأبعاد والتنبؤ بالحركة.
تحتوي مجموعة بيانات التتبع ثلاثية الأبعاد Argoverse على تعليقات التتبع ثلاثية الأبعاد لـ 113 مشهدًا. يبلغ طول كل مقطع ما بين 15 إلى 30 ثانية ويحتوي على إجمالي 11,319 كائنًا متتبعًا. يحتوي كل مقطع مشهد في مجموعة التدريب ومجموعة الاختبار على تعليقات لجميع الكائنات ضمن مسافة خمسة أمتار، والتي يمكن فهمها على أنها اكتشاف جميع الكائنات في المنطقة القابلة للقيادة (5 أمتار) من السيارة وتقديمها في شكل إطار ثلاثي الأبعاد. يمكن استخدام مجموعة البيانات هذه في مجالات مثل القيادة الذاتية.
مجموعة بيانات التنبؤ بالحركة Argoverse عبارة عن مجموعة بيانات لنماذج التنبؤ بالحركة. يحتوي على 327793 مشهدًا، يبلغ طول كل مشهد 5 ثوانٍ ويحتوي على عرض عين الطائر ثنائي الأبعاد لكل كائن متتبع تم أخذ عينات منه بتردد 10 هرتز. تم الحصول على مجموعة البيانات من أكثر من 1000 ساعة من القيادة في الشوارع ويمكن استخدامها في الأبحاث في مجالات مثل القيادة الذاتية.
مجموعة بيانات Argoverse
وكالة النشر: أرجو الذكاء الاصطناعي
الكمية المتضمنة: أكثر من 30000 مشهد
حجم البيانات: 260.38 جيجابايت
وقت الإصدار: 2019
عنوان التنزيل:hyper.ai/datasets/8858
مجموعة بيانات القيادة الذاتية Talk2Car
مجموعة بيانات Talk2Car عبارة عن مجموعة بيانات مرجعية للكائنات.ويحتوي على أوامر مكتوبة باللغة الطبيعية للسيارات ذاتية القيادة، وهو ما يعني أن الركاب يمكنهم إعطاء الأوامر للسيارات ذاتية القيادة عن طريق التحدث.
تعتمد مجموعة بيانات Talk2Car على مجموعة بيانات nuScenes وتتضمن مجموعة واسعة من وسائط الاستشعار، وهي الخرائط الدلالية، ونظام تحديد المواقع العالمي (GPS)، والليدار، والرادار، وصور RGB بزاوية 360 درجة مع تعليقات توضيحية لمربع محيط ثلاثي الأبعاد.
مجموعة بيانات Talk2Car
وكالة النشر: جامعة لوفين الكاثوليكية، بلجيكا
تنسيق البيانات: الصور
حجم البيانات: 1.65 جيجابايت
وقت الإصدار: 2019
عنوان التنزيل:hyper.ai/datasets/18926
للبحث أو تنزيل مجموعة البيانات، قم بزيارة الروابط التالية:
-- زيادة--