HyperAIHyperAI
منذ 2 أشهر

GenPose: تقدير وضعية الكائن على مستوى الفئة من خلال نماذج الانتشار

Zhang, Jiyao ; Wu, Mingdong ; Dong, Hao
GenPose: تقدير وضعية الكائن على مستوى الفئة من خلال نماذج الانتشار
الملخص

تقدير وضعية الكائن يلعب دورًا حاسمًا في الذكاء الاصطناعي المتجسد ورؤية الحاسوب، مما يمكّن الوكلاء الذكيين من فهم التفاعل مع بيئتهم المحيطة. على الرغم من جدوى تقدير وضعية الكائن على مستوى الفئة، فإن الأساليب الحالية تواجه تحديات مع السحابات النقطية الجزئية المشاهدة، المعروفة باسم مشكلة الفرضيات المتعددة. في هذه الدراسة، نقترح حلًا جديدًا بإعادة صياغة تقدير وضعية الكائن على مستوى الفئة كنمذجة توليدية شرطية، مبتعدًا عن الانحدار النقطي التقليدي. باستخدام نماذج التفتيت القائمة على النقاط، نقدر وضعيات الكائنات بأخذ عينات من النموذج التفتيتي وتجميعها عبر عملية ذات خطوتين: تصفيح القيم الشاذة عبر تقدير الاحتمال ثم تجميع المتوسط للمرشحين المتبقيين.为了避免在估计似然性时进行昂贵的积分过程,我们引入了一种替代方法,即从原始基于分数的模型中训练一个基于能量的模型,从而实现端到端的似然性估计。我们的方法在REAL275数据集上达到了最先进的性能,在严格的5d2cm和5d5cm指标上分别超过了50%和60%。此外,我们的方法展示了对具有相似对称属性的新类别的强大泛化能力,无需微调,并且可以轻松适应物体姿态跟踪任务,产生与当前最先进基线相当的结果。为了使翻译更加符合阿拉伯语表达习惯,以下是优化后的版本:تقدير وضعية الكائن يلعب دورًا حاسمًا في الذكاء الاصطناعي المتجسد ورؤية الحاسوب، مما يمكّن الوكلاء الذكيين من فهم التفاعل مع بيئتهم المحيطة. رغم جدواه العملية، فإن الأساليب الحالية لتقدير وضعية الكائن على مستوى الفئة تواجه تحديات مع السحابات النقطية الجزئية المشاهدة، المعروفة باسم مشكلة الفرضيات المتعددة (multihypothesis issue). في هذه الدراسة، نقترح حلًّا جديدًا بإعادة صياغة تقدير وضعية الكائن على مستوى الفئة كنمذجة توليدية شرطية (conditional generative modeling)، مبتعدًا عن الانحدار النقطي التقليدي (point-to-point regression). باستخدام نماذج التفتيت القائمة على النقاط (score-based diffusion models)، نقدر وضعيات الكائنات بأخذ عينات من النموذج التفتيتي وتجميعها عبر عملية ذات خطوتين: تصفيح القيم الشاذة عبر تقدير الاحتمال (likelihood estimation) ثم تجميع المتوسط للمرشحين المتبقيين (mean-pooling). لتجنب عملية التكامل الباهظة الثمن عند تقدير الاحتمال، قدمنا طريقة بديلة تتضمن تدريب نموذج قائم على الطاقة (energy-based model) من النموذج القائم على النقاط الأصلي، مما يمكننا من تحقيق تقدير احتمال شامل ومباشر. أثبتت طريقتنا أداءً رائدًا في مجموعة بيانات REAL275، حيث حققت نسبة تجاوز 50% و60% في مؤشرات الدقة الصارمة 5d2cm و5d5cm على التوالي. بالإضافة إلى ذلك، أظهرت طريقتنا قدرة تعميم قوية لفئات جديدة تشترك في خصائص تناظر مماثلة دون الحاجة إلى ضبط دقيق (fine-tuning)، ويمكنها أن تتكيّف بسهولة مع مهام تتبع وضعية الكائنات، مما يؤدي إلى تحقيق نتائج مقاربة لأحدث الأساليب الرائدة (state-of-the-art baselines).

GenPose: تقدير وضعية الكائن على مستوى الفئة من خلال نماذج الانتشار | أحدث الأوراق البحثية | HyperAI