HyperAIHyperAI
منذ 2 أشهر

MobRecon: إعادة بناء الشبكة ثلاثية الأبعاد لليد من صورة أحادية العدسة بطريقة ملائمة للأجهزة المحمولة

Xingyu Chen; Yufeng Liu; Yajiao Dong; Xiong Zhang; Chongyang Ma; Yanmin Xiong; Yuan Zhang; Xiaoyan Guo
MobRecon: إعادة بناء الشبكة ثلاثية الأبعاد لليد من صورة أحادية العدسة بطريقة ملائمة للأجهزة المحمولة
الملخص

في هذا العمل، نقترح إطارًا لاستعادة الشبكة اليدوية من زاوية واحدة يمكنه تحقيق دقة استعادة عالية وسرعة استدلال سريعة وت Kohherence زمنية في آن واحد. تحديدًا، فيما يتعلق بالترميز ثنائي الأبعاد، نقترح هياكل متراكمة خفيفة ومعتبرة. بالنسبة للتفكيك ثلاثي الأبعاد، نقدم مشغلًا بيانيًا فعالاً يُعرف بالتقاطع العميق الملفوف (Depth-Separable Spiral Convolution). بالإضافة إلى ذلك، نقدم وحدة رفع ميزات جديدة لجسر الفجوة بين التمثيلات ثنائية وثلاثية الأبعاد. تبدأ هذه الوحدة بكتلة ترقيم موقع الخريطة (MapReg) لدمج مزايا كل من منهجيات الترميز الخرائطي والترقيم الموضعي لتحقيق دقة ثنائية أبعاد أفضل وكوهييرنس زمنية. علاوة على ذلك، يتبع MapReg طرق تجميع الوضعيات ورفع الوضعيات إلى الرؤوس (Pose Pooling and Pose-to-Vertex Lifting)، والتي تقوم بتحويل ترميزات الوضعيات ثنائية الأبعاد إلى ميزات معنوية للرؤوس ثلاثية الأبعاد. بشكل عام، يتكون إطارنا لإعادة بناء اليد، الذي يُطلق عليه MobRecon، من تكاليف حسابية معقولة وحجم نموذج صغير جدًا، مما يصل إلى سرعة استدلال عالية تبلغ 83 إطارًا في الثانية على معالج Apple A14. أظهرت التجارب الواسعة على مجموعات بيانات شائعة مثل FreiHAND وRHD وHO3Dv2 أن MobRecon يحقق أداءً فائقًا في دقة الاستعادة والت Kohherence الزمنية. الكود الخاص بنا متاح بشكل عام على الرابط: https://github.com/SeanChenxy/HandMesh.注释:- "Temporal coherence" 在阿拉伯语中通常翻译为 "الت Kohherence الزمنية" 或 "الت Kohherence الزمني". 为了保持专业性和一致性,这里选择了 "الت Kohherence الزمنية".- 其他术语如 "stacked structures" 和 "depth-separable spiral convolution" 使用了通用的阿拉伯语译法,并在括号中标注了原文以确保信息完整。

MobRecon: إعادة بناء الشبكة ثلاثية الأبعاد لليد من صورة أحادية العدسة بطريقة ملائمة للأجهزة المحمولة | أحدث الأوراق البحثية | HyperAI