HyperAI

دروس تعليمية عبر الإنترنت | تم تحديث سلسلة YOLO بـ 11 إصدارًا في 10 سنوات، ووصل الطراز الأحدث إلى SOTA في مهام الكشف عن الأهداف المتعددة

特色图像

YOLO (You Only Look Once) هي واحدة من أكثر خوارزميات اكتشاف الكائنات في الوقت الفعلي تأثيرًا في مجال الرؤية الحاسوبية.إنها مفضلة في الصناعة لدقتها العالية وكفاءتها، وتستخدم على نطاق واسع في القيادة الذاتية ومراقبة الأمن والتصوير الطبي وغيرها من المجالات.

تم نشر النموذج لأول مرة في عام 2015 بواسطة جوزيف ريدمون، وهو طالب دراسات عليا في جامعة واشنطن. كانت رائدة في مفهوم التعامل مع اكتشاف الكائنات باعتباره مشكلة انحدار واحدة، وحققت اكتشاف الكائنات من البداية إلى النهاية، واكتسبت بسرعة اعترافًا واسع النطاق بين المطورين. وفي وقت لاحق، أطلقت فرق تضم أليكسي بوشكوفسكي، وجلين جوتشر (فريق Ultralytics)، وقسم الاستخبارات البصرية في شركة Meituan، عدة إصدارات مهمة.

حتى الآن، وصل عدد نجوم نماذج سلسلة YOLO على GitHub إلى مئات الآلاف، مما يدل على تأثيرها في مجال الرؤية الحاسوبية.

مخطط مثال لمهمة نموذج YOLO

تتميز سلسلة نماذج YOLO بهندسة الكشف ذات المرحلة الواحدة، والتي لا تتطلب إنشاء صندوق مرشح إقليمي معقد ويمكنها إكمال الكشف عن الهدف في انتشار أمامي واحد، مما يحسن سرعة الكشف بشكل كبير. بالمقارنة مع أجهزة الكشف التقليدية ذات المرحلتين (مثل Faster R-CNN)،تتمتع YOLO بسرعة استدلال أسرع، ويمكنها تحقيق معالجة في الوقت الفعلي للصور ذات معدل الإطارات العالي، وتحسين قدرة الأجهزة على التكيف،يتم استخدامه على نطاق واسع في الأجهزة المضمنة وسيناريوهات الحوسبة الحافة.

في الوقت الحالي،أطلق قسم "البرنامج التعليمي" في الموقع الرسمي لشركة HyperAI إصدارات متعددة من سلسلة YOLO، والتي يمكن نشرها بنقرة واحدة لتجربتها~

في نهاية هذه المقالة، سنستخدم الإصدار الأحدث من YOLOv11 كمثال لشرح البرنامج التعليمي للنشر بنقرة واحدة.

1. YOLOv2

وقت الإصدار:2017

تحديث هام:تم اقتراح صناديق المرساة، وتم استخدام Darknet-19 كشبكة أساسية لتحسين السرعة والدقة.

تجميع YOLO-V2 في نموذج DarkNet باستخدام TVM:

https://go.hyper.ai/LiOio

2. YOLOv3

وقت الإصدار:2018

تحديث هام:وباستخدام Darknet-53 كشبكة أساسية، تم تحسين الدقة بشكل كبير مع الحفاظ على السرعة في الوقت الفعلي، وتم اقتراح التنبؤ متعدد المقاييس (بنية FPN)، والذي حقق تحسينات كبيرة في اكتشاف الأشياء ذات الأحجام المختلفة ومعالجة الصور المعقدة.

تجميع YOLO-V3 في نموذج DarkNet باستخدام TVM:

https://go.hyper.ai/LiOio

3 ، YOLOv5

وقت الإصدار:2020

تحديث هام:يساهم تقديم آلية تعديل إطار المرساة التلقائية في الحفاظ على قدرات الكشف في الوقت الفعلي وتحسين الدقة. يتم استخدام تنفيذ PyTorch أخف وزنًا لتسهيل التدريب والنشر.

النشر بنقرة واحدة:https://go.hyper.ai/jxqfm

4 ، YOLOv7

وقت الإصدار:2022

تحديث هام:بناءً على شبكة تجميع الطبقات الفعالة الموسعة، تم تحسين استخدام المعلمات وكفاءة الحوسبة، مما أدى إلى تحقيق أداء أفضل مع موارد حوسبة أقل. تمت إضافة مهام إضافية مثل تقدير الوضع على مجموعة بيانات النقاط الرئيسية COCO.

النشر بنقرة واحدة:https://go.hyper.ai/d1Ooq

5 ، YOLOv8

وقت الإصدار:2023

تحديث هام:

إنه يعتمد على شبكة أساسية جديدة ويقدم رأس كشف جديد بدون مرساة ووظيفة خسارة، والتي تتفوق على الإصدارات السابقة من حيث الدقة المتوسطة والحجم والزمن الكامن.

النشر بنقرة واحدة:https://go.hyper.ai/Cxcnj

6 ، YOLOv10

وقت الإصدار:مايو 2024

تحديث هام:يزيل متطلبات القمع غير الأقصى (NMS)، مما يقلل من زمن انتقال الاستدلال. يؤدي دمج التفاف النواة الكبير ووحدات الاهتمام الذاتي الجزئية إلى تحسين الأداء دون إضافة الكثير من التكلفة الحسابية. تم تحسين المكونات المختلفة بالكامل لتحسين الكفاءة والدقة.

نشر اكتشاف هدف YOLOv10 بنقرة واحدة:

https://go.hyper.ai/TQH1f

نشر اكتشاف كائنات YOLOv10 بنقرة واحدة:

https://go.hyper.ai/RcLWj

7 ، YOLOv11

وقت الإصدار:سبتمبر 2024

تحديث هام:يقدم أداءً متطورًا (SOTA) في مهام متعددة بما في ذلك الاكتشاف والتجزئة وتقدير الوضع والتتبع والتصنيف، ويستفيد من القدرات من مجموعة واسعة من تطبيقات ومجالات الذكاء الاصطناعي.

النشر بنقرة واحدة:https://go.hyper.ai/Nztnq

دليل نشر YOLOv11 بنقرة واحدة

تم الآن إطلاق قسم البرنامج التعليمي HyperAI HyperNeural "نشر YOLOv11 بنقرة واحدة". لقد قام البرنامج التعليمي بإعداد البيئة للجميع. لا تحتاج إلى إدخال أي أوامر. ما عليك سوى النقر فوق "استنساخ" لتجربة الوظائف القوية لـ YOLOv11 بسرعة!

عنوان البرنامج التعليمي:https://go.hyper.ai/Nztnq

تشغيل تجريبي

1. قم بتسجيل الدخول إلى hyper.ai، في صفحة البرنامج التعليمي، حدد نشر YOLOv11 بنقرة واحدة، ثم انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

3. انقر فوق "التالي: حدد معدل التجزئة" في الزاوية اليمنى السفلية.

4. بعد الانتقال إلى الصفحة التالية، حدد الصورتين "NVIDIA RTX 4090" و"PyTorch". يمكن للمستخدمين اختيار "الدفع حسب الاستخدام" أو "الباقة اليومية/الأسبوعية/الشهرية" وفقًا لاحتياجاتهم. بعد الانتهاء من الاختيار، انقر فوق "التالي: المراجعة".يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات من وقت فراغ وحدة المعالجة المركزية!

رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):

https://openbayes.com/console/signup?r=Ada0322_QZy7

5. بعد التأكيد، انقر فوق "متابعة" وانتظر حتى يتم تخصيص الموارد. ستستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي. يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.

عرض التأثير

1. افتح صفحة العرض التوضيحي لاكتشاف الكائنات في YOLOv11. لقد قمت برفع صورة للحيوانات المكدسة، وضبطت المعلمات، ثم نقرت على "إرسال". يمكنك أن ترى أن YOLOv11 قد اكتشف بدقة جميع الحيوانات في الصورة. اتضح أن هناك طائرًا صغيرًا مختبئًا في الزاوية اليمنى السفلية! هل لاحظت؟

تمثل المعلمات التالية:

* نموذج:يشير إلى إصدار نموذج YOLO المحدد للاستخدام.

* حجم الصورة:حجم الصورة المدخلة. سيقوم النموذج بتغيير حجم الصورة إلى هذا الحجم أثناء الاكتشاف.

* عتبة الثقة:تعني عتبة الثقة أنه عندما يقوم النموذج باكتشاف الهدف، فسيتم اعتبار نتائج الاكتشاف التي تتجاوز ثقتها هذه القيمة المحددة فقط كأهداف صالحة.

2. أدخل صفحة عرض التجزئة التجريبية، وقم بتحميل الصورة وضبط المعلمات، ثم انقر فوق "إرسال" لإكمال عملية التجزئة. حتى مع الانسدادات، يقوم YOLOv11 بعمل ممتاز في تقسيم الأشخاص بدقة وتحديد الخطوط العريضة للحافلة.

3. أدخل صفحة عرض تصنيف الكائنات. قام المحرر برفع صورة ثعلب. يمكن لـ YOLOv11 اكتشاف النوع المحدد للثعلب في الصورة بدقة باعتباره ثعلبًا أحمر.

4. أدخل صفحة عرض التعرف على الإيماءات، وقم بتحميل الصورة، واضبط المعلمات وفقًا للصورة، ثم انقر فوق "إرسال" لإكمال تحليل حركة الإيماءات. يمكنك أن ترى أنه يحلل بدقة حركات الجسم المبالغ فيها للشخصية.

5. في صفحة العرض التوضيحي لاكتشاف الكائنات الموجهة، قم بتحميل صورة وضبط المعلمات، ثم انقر فوق "إرسال" لتحديد الموقع المحدد وتصنيف الكائن.