منذ 7 أشهر

الملخص

يصف تدفق المشهد حركة الأجسام ثلاثية الأبعاد في العالم الحقيقي ويمكن أن يكون أساسًا جيدًا لميزة لتمييز الإجراءات ثلاثية الأبعاد. ومع ذلك، لم يتم دراسة استخدامه في تمييز الإجراءات، خاصة في سياق الشبكات العصبية التلافيفية (ConvNets) سابقًا. في هذا البحث، نقترح استخراج واستخدام تدفق المشهد لتمييز الإجراءات من بيانات RGB-D. لقد اعتبرت الأعمال السابقة موديلات العمق والRGB قنوات منفصلة واستخرجت الميزات للدمج لاحقًا. نحن نتبع نهجًا مختلفًا ونعتبر الموديلات ككيان واحد، مما يسمح باستخراج الميزات لتمييز الإجراءات من البداية.يتناول البحث إجابتين أساسيتين حول استخدام تدفق المشهد لتمييز الإجراءات: كيف يمكن تنظيم متجهات تدفق المشهد وكيف يمكن تمثيل الديناميكيات طويلة الأمد للمواد المصورة بناءً على تدفق المشهد. من أجل حساب تدفق المشهد بشكل صحيح على المجموعات المتاحة من البيانات، نقترح طريقة تعديل ذاتي فعالة لتوفيق بيانات RGB والعمق مكانيًا دون الحاجة لمعرفة معلمات الكاميرا. بناءً على متجهات تدفق المشهد، نقترح تمثيلًا جديدًا يُعرف بـ خريطة تدفق المشهد إلى الإجراء (Scene Flow to Action Map - SFAM)، والذي يصف عدة ديناميكيات زمانية-مكانية طويلة الأمد لتمييز الإجراءات.نتبنى نواة تحويل القنوات لتحويل متجهات تدفق المشهد إلى فضاء ألوان أمثل مشابه للـ RGB. هذه التحويلة تستفيد بشكل أفضل من النماذج التي تم تدريبها على ImageNet. تشير النتائج التجريبية إلى أن هذا التمثيل الجديد يمكن أن يتخطى أداء الطرق الرائدة في مجالها على كل من مجموعة بيانات عامة كبيرة.(ملاحظة: "ImageNet" هو اسم مشروع معروف في مجال المعالجة البصرية للآلة ولا يحتاج إلى ترجمة.)

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Pichao Wang Wanqing Li Zhimin Gao† Yuyao Zhang Chang Tang Philip Ogunbona

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Pichao Wang Wanqing Li Zhimin Gao† Yuyao Zhang Chang Tang Philip Ogunbona

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Pichao Wang Wanqing Li Zhimin Gao† Yuyao Zhang Chang Tang Philip Ogunbona

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تدفق المشهد إلى خريطة الحركة: تمثيل جديد للاعتراف بالحركة باستخدام شبكات العصب الاصطناعية التلافيفية مع بيانات RGB-D

Pichao Wang Wanqing Li Zhimin Gao† Yuyao Zhang Chang Tang Philip Ogunbona

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تدفق المشهد إلى خريطة الحركة: تمثيل جديد للاعتراف بالحركة باستخدام شبكات العصب الاصطناعية التلافيفية مع بيانات RGB-D

Pichao Wang Wanqing Li Zhimin Gao† Yuyao Zhang Chang Tang Philip Ogunbona

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تدفق المشهد إلى خريطة الحركة: تمثيل جديد للاعتراف بالحركة باستخدام شبكات العصب الاصطناعية التلافيفية مع بيانات RGB-D

Pichao Wang Wanqing Li Zhimin Gao† Yuyao Zhang Chang Tang Philip Ogunbona

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters