HyperAIHyperAI

Command Palette

Search for a command to run...

segmentation الفيديو للبوليپ: منظور التعلم العميق

Ge-Peng Ji†1 Guobao Xiao†2 Yu-Cheng Chou†3 Deng-Ping Fan‡4 Kai Zhao5 Geng Chen6 Luc Van Gool4

الملخص

نقدم أول دراسة شاملة للتقسيم البؤري للفيديو (VPS) في عصر التعلم العميق. على مر السنين، لم تشهد تطورات التقسيم البؤري للفيديو تقدماً سهلاً بسبب نقص التسميات الدقيقة على نطاق واسع. لمعالجة هذه المشكلة، نقدم أولاً مجموعة بيانات SUN-SEG ذات الجودة العالية والمُشَرَّحة إطارًا بإطار، والتي تحتوي على 158,690 إطارًا من الفحوصات القولونية من قاعدة البيانات الشهيرة SUN-database. نوفر أيضًا تسميات إضافية بأنواع متنوعة، مثل السمات، والقناع الكائني، والحدود، والخربشات، والمضلعات. ثانيًا، صممنا خط أساس بسيط ولكن فعال يُعرف باسم PNS+، يتكون من مشفِّر عالمي، ومشفِّر محلي، وكتل انتباه ذاتي مُعَدَّلة (NS). يتلقى المشفِّران العاملان العالمي والمحلي إطارًا رئيسيًا وإطارات متتالية متعددة لاستخراج تمثيلات زمانية-مكانية طويلة الأجل وقصيرة الأجل، والتي يتم تحديثها تدريجيًا بواسطة كتلتي NS. أظهرت التجارب الواسعة أن PNS+ يحقق أفضل الأداء وسرعة استدلال في الوقت الحقيقي (170 إطارًا في الثانية)، مما يجعله حلًّا واعدًا للمهمة VPS. ثالثًا، نقيم بشكل مكثف 13 نموذج تقسيم بؤري/كائني ممثلة على مجموعة بياناتنا SUN-SEG ونقدم مقارنات قائمة على السمات. وأخيرًا، نناقش عدة قضايا مفتوحة وتلميح إلى اتجاهات بحثية محتملة لمجتمع VPS.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
segmentation الفيديو للبوليپ: منظور التعلم العميق | مستندات | HyperAI