HyperAIHyperAI

Command Palette

Search for a command to run...

YOLOE: شاهد كل شيء في الوقت الحقيقي

Date

منذ 10 أشهر

Size

1.94 GB

License

Apache 2.0

Paper URL

2503.07465

1. مقدمة البرنامج التعليمي

يُعدّ YOLOE نموذجًا جديدًا للرؤية الآنية، اقترحه فريق بحثي في جامعة تسينغهوا عام 2025، بهدف تحقيق رؤية شاملة في الوقت الفعلي. يرث هذا النموذج خصائص الكفاءة والسرعة في الوقت الفعلي لنماذج سلسلة YOLO، ويُدمج بعمق تقنيات التعلّم بدون بيانات تدريبية وقدرات التوجيه متعدد الوسائط، مما يُتيح اكتشاف الأجسام وتقسيمها في سيناريوهات متنوعة، تشمل النصوص والرؤية والسيناريوهات غير المُوجّهة. تتوفر أوراق بحثية ذات صلة. YOLOE: رؤية أي شيء في الوقت الفعلي .

منذ إطلاقه في عام 2015، أصبح تطبيق YOLO (You Only Look Once) رائدًا في مجال اكتشاف الكائنات وتجزئة الصور.فيما يلي تطور سلسلة YOLO والبرامج التعليمية ذات الصلة:

الميزات الأساسية

  1. أي نوع من النص

2. المطالبات متعددة الوسائط:

  • الإشارات البصرية (المربعات/النقاط/الأشكال المرسومة يدويًا/الصور المرجعية) 
  1. الكشف الصامت التلقائي بالكامل - التعرف تلقائيًا على كائنات المشهد

بيئة العرض التوضيحي: سلسلة YOLOv8e/YOLOv11e + RTX4090

2. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. يرجى الانتظار لمدة 1-2 دقيقة ثم قم بتحديث الصفحة.

2. عرض دالة YOLOE

1. اكتشاف مطالبة النص

  • أي نوع من النص
  • كلمات موجهة مخصصة:يسمح للمستخدم بإدخال نص عشوائي (قد تختلف نتائج التعرف حسب التعقيد الدلالي)

2. الإشارات البصرية متعددة الوسائط

  • 🟦  كشف اختيار الصندوق (صناديق البريد)
    bboxes: على سبيل المثال، إذا قمت بتحميل صورة تحتوي على العديد من الأشخاص وتريد اكتشاف الأشخاص في الصورة، فيمكنك استخدام bboxes لتحديد شخص واحد. أثناء الاستدلال، سوف يقوم النموذج بتحديد جميع الأشخاص في الصورة استنادًا إلى محتوى المربعات.
    يمكن رسم مربعات متعددة للحصول على إشارات بصرية أكثر دقة.
  • ✏️  منطقة النقر/الرسم (أقنعة)
    الأقنعة: على سبيل المثال، إذا قمت بتحميل صورة تحتوي على العديد من الأشخاص وتريد اكتشاف الأشخاص في الصورة، فيمكنك استخدام الأقنعة لتغطية شخص واحد. أثناء الاستدلال، سيتعرف النموذج على جميع الأشخاص في الصورة استنادًا إلى محتوى الأقنعة.
    يمكنك رسم أقنعة متعددة للحصول على إشارات بصرية أكثر دقة.
  • 🖼️  مقارنة الصور المرجعية (داخلي/متقاطع)
    Intra: تشغيل صناديق bboxes أو الأقنعة على الصورة الحالية وإجراء الاستدلال على الصورة الحالية.
    تقاطع: تشغيل مربعات bboxes أو الأقنعة على الصورة الحالية والاستدلال على الصور الأخرى.

المفاهيم الأساسية

نموذجالوصف الوظيفيسيناريو التطبيق
داخل الصورةنمذجة علاقات الكائنات داخل رسم بياني واحدتحديد موقع الهدف المحلي بدقة
صورة متقاطعةمطابقة ميزات الصور المتقاطعةاسترجاع كائنات مماثلة

3. الكشف التلقائي الكامل دون مطالبة

  • 🔍  تحليل المشهد الذكي:تحديد جميع الكائنات البارزة في الصورة تلقائيًا
  • 🚀  بدء التشغيل بدون تكوين:يعمل بدون أي إدخال فوري

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp