HyperAIHyperAI

Command Palette

Search for a command to run...

الأسئلة وال الأجوبة العصبية-الرمزية: فصل التفكير عن فهم الرؤية واللغة

الملخص

نجمع بين فكرتين قويتين: التعلم العميق للتمثيلات للاعتراف البصري وفهم اللغة، والتنفيذ الرمزي للبرامج للمنطق. نظام الإجابة على الأسئلة البصرية العصبي-الرمزي (NS-VQA) الخاص بنا يقوم أولاً باستعادة تمثيل مشهد هيكلي من الصورة وأثر برنامج من السؤال. ثم ينفذ البرنامج على تمثيل المشهد للحصول على إجابة. دمج الهيكل الرمزي كمعارف مسبقة يقدم ثلاثة مزايا فريدة. أولاً، تنفيذ البرامج في الفضاء الرمزي أكثر صلابة تجاه أثر البرامج الطويل؛ يمكن لنموذجنا حل المهام المنطقية المعقدة بشكل أفضل، حيث حقق دقة تبلغ 99.8% على مجموعة بيانات CLEVR. ثانياً، النموذج أكثر كفاءة في استخدام البيانات والذاكرة: يحقق أداءً جيدًا بعد التعلم على عدد صغير من البيانات التدريبية؛ كما يمكنه تشفير الصورة في تمثيل مضغوط، مما يتطلب تخزينًا أقل من الطرق الحالية للإجابة على الأسئلة دون اتصال. ثالثاً، تنفيذ البرنامج الرمزي يوفر شفافية كاملة للمعالجة المنطقية؛ وبالتالي نتمكن من تفسير وتشخيص كل خطوة في التنفيذ.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الأسئلة وال الأجوبة العصبية-الرمزية: فصل التفكير عن فهم الرؤية واللغة | مستندات | HyperAI