HyperAIHyperAI

Command Palette

Search for a command to run...

كشف التفاعل البشري-الكائن من الطرف إلى الطرف باستخدام HOI Transformer

الملخص

نُقدّم نموذج HOI Transformer للتعامل مع كشف تفاعل الإنسان مع الكائن (HOI) بطريقة نهائية (end-to-end). تُركّز الطرق الحالية إما على فصل مهمة HOI إلى مراحل منفصلة للكشف عن الكائنات وتصنيف التفاعلات، أو تُقدّم مشكلة تفاعل بديلة (surrogate interaction problem). على العكس، يبسّط نهجنا، المُسمّى HOI Transformer، عملية كشف HOI من خلال التخلّص من الحاجة إلى العديد من المكوّنات المصمّمة يدويًا. يحلّل نموذج HOI Transformer العلاقات بين الإنسان والكائنات استنادًا إلى السياق العام للصورة، ويتوقّع حالات التفاعل HOI بشكل متوازٍ مباشرة. كما تمّ تقديم خسارة مطابقة خماسية (quintuple matching loss) لفرض التنبؤات الخاصة بـ HOI بطريقة موحّدة. يتميّز نهجنا ببساطة مفاهيمية كبيرة ويُظهر دقة محسّنة. وبلا تعقيدات إضافية، حقّق نموذج HOI Transformer أداءً بنسبة 26.61%26.61\%26.61% APAPAP على مجموعة HICO-DET، و52.9%52.9\%52.9% AProleAP_{role}AProle على مجموعة V-COCO، متفوّقًا على الطرق السابقة مع ميزة البساطة الكبيرة. نأمل أن يُشكّل هذا النهج بديلاً بسيطًا وفعالًا لمهمّات HOI. يمكن الوصول إلى الكود من خلال الرابط: https://github.com/bbepoch/HoiTransformer.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp