Command Palette
Search for a command to run...
التمييز السريع التفاعلي للكائنات في الفيديو باستخدام شبكات الجراف العصبية
التمييز السريع التفاعلي للكائنات في الفيديو باستخدام شبكات الجراف العصبية
Viktor Varga András Lőrincz
الملخص
الشروح البكسلية لسلسلة الصور يمكن أن تكون مرهقة للغاية للبشر.يهدف تقسيم الأشياء في الفيديو التفاعلي إلى استخدام الطرق الآلية لتسريع العملية وتقليل عبء العمل على المشرفين. تعتمد معظم الأساليب الحديثة على شبكات ال Discounts (الشبكات العصبية التلافيفية العميقة) لجمع ومعالجة المعلومات من الشروح البشرية عبر الفيديو. ومع ذلك، تحتوي هذه الشبكات على ملايين المعالم وتحتاج إلى كميات ضخمة من البيانات التدريبية المصنفة لتجنب الانعراج الزائد. بالإضافة إلى ذلك، يتم تنفيذ انتشار التسميات عادةً كسلسلة من خطوات الاستدلال الإطار بإطار، مما يجعل من الصعب توازيها وبالتالي تكون عملية مستهلكة للوقت. في هذا البحث، نقدم نهجًا يستند إلى الشبكات العصبية الرسومية لحل مشكلة تقسيم الأشياء في الفيديو التفاعلي. تعمل شبكتنا على رسومات السوبر بكسل التي تتيح لنا تقليل بُعد المشكلة بمقدار عدة أضعاف. نوضح أن شبكتنا التي تحتوي على بضعة آلاف فقط من المعالم قادرة على تحقيق أداء يتفوق على أفضل ما هو موجود حاليًا، بينما يظل الاستدلال سريعًا ويمكن تدريبها بسرعة باستخدام بيانات قليلة جدًا.