نشر YOLOv11 بنقرة واحدة
YOLO11: أحدث إصدار من سلسلة YOLO، وهو خيار متعدد الاستخدامات لمهام الرؤية الحاسوبية

1. مقدمة البرنامج التعليمي
YOLOv11 هو أحدث إصدار من كاشف الكائنات في الوقت الفعلي الذي طوره فريق Ultralytics وتم الإعلان عنه في حدث YOLO Vision 2024 (YV24) في 30 سبتمبر 2024. يوفر YOLOv11 تحسينات كبيرة في الدقة والسرعة والكفاءة، مما يجعله أداة قوية لمهام الرؤية الحاسوبية. ويهدف إطلاق YOLOv11 إلى تبسيط عملية التطوير وتوفير حجر الأساس للتكامل اللاحق. إنه يوفر تحسينات كبيرة في الهندسة المعمارية وطرق التدريب مقارنة بالإصدارات السابقة من نموذج YOLO، مما يجعله خيارًا متعدد الاستخدامات لمجموعة متنوعة من مهام الرؤية الحاسوبية. يشكل إطلاق YOLOv11 معلمًا جديدًا في تكنولوجيا اكتشاف الكائنات. إنه لا يضع معيارًا جديدًا للسرعة والدقة فحسب، بل الأهم من ذلك أن تصميمه المعماري المبتكر يجعل مهام اكتشاف الكائنات المعقدة في متناول اليد.
بالإضافة إلى ذلك، فإن عملية تثبيت YOLOv11 بسيطة نسبيًا. يمكن للمطورين تنزيل أحدث كود المصدر من صفحة GitHub الخاصة به واتباع الدليل لإجراء اختبار سطر الأوامر لتوقعات النموذج. يستخدم هذا البرنامج التعليمي YOLOv11. تم تثبيت النموذج والبيئة ذات الصلة. يمكنك استنساخ عنوان API وفتحه مباشرةً لإجراء استنتاج النموذج وتحقيق اكتشاف الصور وتقسيمها وتقدير الوضع والتتبع والتصنيف.
تتضمن التحسينات الرئيسية في YOLOv11 ما يلي:
- استخراج الميزات المحسّن: تم تحسين بنية العمود الفقري والرقبة للكشف عن الكائنات بشكل أكثر دقة.
- سرعة معالجة مُحسَّنة: يتيح تصميم الهندسة المعمارية الجديدة وطرق التدريب سرعة معالجة أسرع.
- دقة أعلى مع معلمات أقل: في مجموعة بيانات COCO، يحقق YOLOv11m دقة متوسطة (mAP) أعلى من YOLOv8m مع استخدام معلمات أقل.
- قدرة قوية على التكيف مع البيئة: يمكن نشر YOLOv11 في مجموعة متنوعة من البيئات، بما في ذلك أجهزة الحافة، ومنصات السحابة، والأنظمة التي تدعم وحدات معالجة الرسومات NVIDIA.
- دعم لمجموعة واسعة من المهام: يدعم YOLOv11 مجموعة متنوعة من مهام الرؤية الحاسوبية مثل اكتشاف الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، واكتشاف الكائنات الموجهة (OBB).
تاريخ تطوير YOLO
YOLO (You Only Look Once) هو نموذج شائع لكشف الكائنات وتقسيم الصور تم تطويره بواسطة جوزيف ريدمون وعلي فرهادي في جامعة واشنطن. تم إطلاق YOLO في عام 2015 واكتسب شعبية سريعة بسبب سرعته العالية ودقته.
- تم إصدار YOLOv2 في عام 2016، وقد تم تحسينه على النموذج الأصلي من خلال دمج التطبيع الدفعي، وصناديق المرساة، وتجميع الأبعاد.
- تم إطلاق YOLOv3 في عام 2018، مما أدى إلى تعزيز أداء النموذج بشكل أكبر باستخدام شبكة أساسية أكثر كفاءة، ومتعددة المراسي، وتجميع الهرم المكاني.
- تم إصدار YOLOv4 في عام 2020، حيث قدم ابتكارات مثل زيادة بيانات Mosaic، ورأس اكتشاف جديد بدون مرساة، ووظيفة خسارة جديدة.
- يعمل YOLOv5 على تحسين أداء النموذج بشكل أكبر ويضيف ميزات جديدة مثل تحسين المعلمات الفائقة وتتبع التجربة المتكاملة والتصدير التلقائي إلى تنسيقات التصدير الشائعة.
- تم إطلاق YOLOv6 كمصدر مفتوح بواسطة Meituan في عام 2022 ويُستخدم حاليًا في العديد من روبوتات التوصيل المستقلة الخاصة بالشركة.
- يضيف YOLOv7 مهام إضافية مثل تقدير الوضع على مجموعة بيانات النقاط الرئيسية COCO.
- تم إصدار YOLOv8 بواسطة Ultralytics في عام 2023. يقدم YOLOv8 ميزات وتحسينات جديدة لتعزيز الأداء والمرونة والكفاءة، ودعم مجموعة كاملة من مهام الذكاء الاصطناعي المرئي.
- يقدم YOLOv9 طرقًا مبتكرة مثل معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
- تم إنشاء YOLOv10 بواسطة باحثين في جامعة تسينغهوا باستخدام هذه الحزمة. تم إنشاؤه بواسطة حزمة UltralyticsPython. يحقق هذا الإصدار تقدمًا في اكتشاف الكائنات في الوقت الفعلي من خلال تقديم رأس من البداية إلى النهاية والقضاء على متطلب القمع غير الأقصى (NMS).
- YOLOv11 🚀 جديد: يوفر أحدث طراز YOLO من Ultralytics أداءً متطورًا (SOTA) في مهام متعددة بما في ذلك الاكتشاف والتجزئة وتقدير الوضع والتتبع والتصنيف، والاستفادة من القدرات من مجموعة واسعة من تطبيقات ومجالات الذكاء الاصطناعي.
2. خطوات التشغيل
بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

يحتوي هذا البرنامج التعليمي على 5 وظائف:
- اكتشاف الكائنات
- تجزئة المثيلات
- تصنيف الصور
- تقدير الوضعية
- تحديد موقع الكشف عن الكائنات
1. اكتشاف الكائنات
كاشف الأشياءيكون الناتج عبارة عن مجموعة من المربعات المحددة التي تحيط بالكائنات في الصورة، بالإضافة إلى تسمية الفئة ودرجة الثقة لكل مربع محدد. يعد اكتشاف الكائنات خيارًا جيدًا إذا كنت بحاجة إلى تحديد الكائنات المثيرة للاهتمام في مشهد ما ولكنك لا تحتاج إلى معرفة موقعها الدقيق أو شكلها.


الشكل 1 اكتشاف الكائنات
2. تجزئة المثيلات
نموذج تجزئة المثيلاتيكون الناتج عبارة عن مجموعة من الأقنعة أو الخطوط العريضة التي تحدد كل كائن في الصورة، بالإضافة إلى تسمية الفئة ودرجة الثقة لكل كائن. تُعد عملية تقسيم الحالات مفيدة للغاية عندما تحتاج إلى معرفة ليس فقط مكان وجود الكائنات في صورة ما، بل أيضًا أشكالها الدقيقة.


الشكل 2 تقسيم المثيلات
3. تصنيف الصور
إن مخرجات مصنف الصور عبارة عن تسمية فئة واحدة ودرجة ثقة. يعد تصنيف الصور مفيدًا عندما تحتاج فقط إلى معرفة الفئة التي تنتمي إليها الصورة، دون معرفة الموقع أو الشكل الدقيق للأشياء في تلك الفئة.


الشكل 3 تصنيف الصورة
4. تقدير الوضعية

تقدير الوضع هو مهمة تتضمن تحديد مواقع نقاط محددة (غالبًا ما تسمى النقاط الرئيسية) في الصورة. يمكن أن تمثل النقاط الرئيسية أجزاء من كائن ما، مثل المفاصل أو المعالم أو الميزات البارزة الأخرى. يتم التعبير عن موقع النقاط الرئيسية عادةً كمجموعة من إحداثيات ثنائية الأبعاد [x, y] أو ثلاثية الأبعاد [x, y, مرئية].
إن مخرجات نموذج تقدير الوضع عبارة عن مجموعة من النقاط التي تمثل النقاط الرئيسية للأشياء في الصورة، وعادةً ما تتضمن أيضًا درجة ثقة لكل نقطة. يعد تقدير الوضع خيارًا جيدًا عندما تحتاج إلى تحديد أجزاء معينة من الكائنات في مشهد وموقعها بالنسبة لبعضها البعض.


الشكل 4 تقدير الوضعية
5. الكشف الموجه عن الكائنات
يذهب اكتشاف الكائنات الموجهة إلى خطوة أبعد من اكتشاف الكائنات من خلال تقديم زاوية إضافية لتحديد موقع الكائنات في الصورة بشكل أكثر دقة.
إن مخرجات كاشف الكائنات الموجهة عبارة عن مجموعة من المربعات المحددة الدائرية التي تحيط بدقة بالكائنات الموجودة في الصورة، بالإضافة إلى تسمية الفئة ودرجة الثقة لكل مربع محدد. يعد اكتشاف الكائنات خيارًا جيدًا عندما تحتاج إلى تحديد الكائنات المثيرة للاهتمام في مشهد ما، ولكنك لا تحتاج إلى معرفة موقعها الدقيق أو شكلها الدقيق.


الشكل 5: الكشف عن الكائنات الموجهة
التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
