HyperAIHyperAI

Command Palette

Search for a command to run...

الانتباه المتقاطع للوحدات المُنفصلة في استعادة شبكة الإنسان ثلاثية الأبعاد باستخدام المحولات

Junhyeong Cho Kim Youwang Tae-Hyun Oh

الملخص

لقد حققت هياكل الترميفورمر المُشفّرة حديثًا نتائج رائدة في مجال إعادة بناء شبكة الإنسان ثلاثية الأبعاد من صورة واحدة، لكنها تتطلب عددًا كبيرًا من المعاملات وحسابات مكلفة. وبسبب الارتفاع الكبير في استهلاك الذاكرة وسرعة الاستنتاج البطيئة، يصعب تطبيق هذه النماذج في الاستخدام العملي. في هذا البحث، نقترح معمارية جديدة لترميفورمر مُشفّر-مُفكّك لإعادة بناء الشبكة ثلاثية الأبعاد للإنسان من صورة واحدة، تُسمى FastMETRO. نحدد أن العائق الرئيسي في الأداء بالنسبة للنماذج القائمة على المُشفّر ناتج عن تصميم الرموز (tokens) الذي يؤدي إلى تفاعلات معقدة للغاية بين الرموز المدخلة. ونفصل هذه التفاعلات من خلال معمارية المُشفّر-المُفكّك، مما يسمح لنماذجنا باستخدام عدد أقل بكثير من المعاملات ووقت استنتاج أقصر. بالإضافة إلى ذلك، نُطبّق معرفة مسبقة حول العلاقات الشكلية للجسم البشري من خلال تقنيات قناع الانتباه (attention masking) وعمليات رفع دقة الشبكة (mesh upsampling)، مما يؤدي إلى تقارب أسرع ودقة أعلى. تُحسّن FastMETRO حدود بايرتو (Pareto-front) بين الدقة والكفاءة، وتفوق بوضوح الطرق القائمة على الصور في مجموعتي البيانات Human3.6M و3DPW. علاوة على ذلك، نُثبت قدرتها على التعميم على مجموعة بيانات FreiHAND.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp