HyperAIHyperAI
منذ 2 أشهر

الوقوف لكل شيء: نحو تقدير الوضعية دون تمييز بين الفئات

Xu, Lumin ; Jin, Sheng ; Zeng, Wang ; Liu, Wentao ; Qian, Chen ; Ouyang, Wanli ; Luo, Ping ; Wang, Xiaogang
الوقوف لكل شيء: نحو تقدير الوضعية دون تمييز بين الفئات
الملخص

الأبحاث الحالية في تقدير الوضعية ثنائية الأبعاد تركز بشكل أساسي على فئة معينة، مثل البشر، الحيوانات، والمركبات. ومع ذلك، هناك العديد من السيناريوهات التطبيقية التي تتطلب اكتشاف وضعيات/نقاط المفتاح لفئات غير معروفة من الأشياء. في هذا البحث، نقدم مهمة تقدير الوضعية المستقلة عن الفئة (CAPE)، والتي تهدف إلى إنشاء نموذج تقدير وضعية قادر على اكتشاف وضعية أي فئة من الأشياء بناءً على عينات قليلة تحتوي على تعريف لنقاط المفتاح. لتحقيق هذا الهدف، نصيغ مشكلة تقدير الوضعية كمشكلة مطابقة نقاط المفتاح ونصمم إطارًا جديدًا لـ CAPE يُسمى شبكة مطابقة الوضعية (POMNet). تم اقتراح وحدة تفاعل النقاط المفتاحية المستندة إلى الترانسفورمر (KIM) لالتقاط التفاعلات بين النقاط المفتاحية المختلفة والعلاقة بين الصور الداعمة والاستعلام. كما قمنا بتقديم مجموعة بيانات وضعيات متعددة الفئات (MP-100)، وهي مجموعة بيانات للوضعية ثنائية الأبعاد تحتوي على 100 فئة من الأشياء وتضم أكثر من 20 ألف حالة، وقد صُممت بشكل جيد لتطوير خوارزميات CAPE. تظهر التجارب أن طريقتنا تتفوق على الأساليب الأساسية الأخرى بمarge كبير. يمكن الوصول إلى الكود والبيانات عبر الرابط https://github.com/luminxu/Pose-for-Everything.注释:在最后一句中,“marge” 是指“幅度”或“差距”,但为了保持句子的流畅性和正式性,这里直接翻译为“بمarge كبير”(以较大的幅度)。如果需要更具体的术语,可以将其翻译为 “بفجوة كبيرة” 或 “بفارق كبير”。

الوقوف لكل شيء: نحو تقدير الوضعية دون تمييز بين الفئات | أحدث الأوراق البحثية | HyperAI