HyperAIHyperAI

Command Palette

Search for a command to run...

أساس بسيط للإجابة على الأسئلة البصرية

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

الملخص

نقدم نموذجًا أساسيًا بسيطًا للغاية يستند إلى حقيبة الكلمات (bag-of-words) للإجابة على الأسئلة البصرية. يجمع هذا النموذج الأساسي ميزات الكلمات من السؤال وميزات CNN من الصورة للتنبؤ بالإجابة. عند تقييمه على مجموعة بيانات VQA [2] الصعبة، يظهر أداءً مماثلًا لأداء العديد من الطرق الحديثة التي تستخدم الشبكات العصبية المتكررة. لاستكشاف نقاط القوة والضعف للنموذج المدرب، نوفر أيضًا واجهة تفاعلية عبر الويب وكود مصدر مفتوح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
أساس بسيط للإجابة على الأسئلة البصرية | مستندات | HyperAI