منذ 7 أشهر

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind

الملخص

نجمع بين فكرتين قويتين: التعلم العميق للتمثيلات للاعتراف البصري وفهم اللغة، والتنفيذ الرمزي للبرامج للمنطق. نظام الإجابة على الأسئلة البصرية العصبي-الرمزي (NS-VQA) الخاص بنا يقوم أولاً باستعادة تمثيل مشهد هيكلي من الصورة وأثر برنامج من السؤال. ثم ينفذ البرنامج على تمثيل المشهد للحصول على إجابة. دمج الهيكل الرمزي كمعارف مسبقة يقدم ثلاثة مزايا فريدة. أولاً، تنفيذ البرامج في الفضاء الرمزي أكثر صلابة تجاه أثر البرامج الطويل؛ يمكن لنموذجنا حل المهام المنطقية المعقدة بشكل أفضل، حيث حقق دقة تبلغ 99.8% على مجموعة بيانات CLEVR. ثانياً، النموذج أكثر كفاءة في استخدام البيانات والذاكرة: يحقق أداءً جيدًا بعد التعلم على عدد صغير من البيانات التدريبية؛ كما يمكنه تشفير الصورة في تمثيل مضغوط، مما يتطلب تخزينًا أقل من الطرق الحالية للإجابة على الأسئلة دون اتصال. ثالثاً، تنفيذ البرنامج الرمزي يوفر شفافية كاملة للمعالجة المنطقية؛ وبالتالي نتمكن من تفسير وتشخيص كل خطوة في التنفيذ.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

HyperAI

منذ 7 أشهر

الإجابة على الأسئلة البصرية

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind

الملخص

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

الأسئلة وال الأجوبة العصبية-الرمزية: فصل التفكير عن فهم الرؤية واللغة

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind2 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

الأسئلة وال الأجوبة العصبية-الرمزية: فصل التفكير عن فهم الرؤية واللغة

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind2 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

الأسئلة وال الأجوبة العصبية-الرمزية: فصل التفكير عن فهم الرؤية واللغة

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind2 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind

Kexin Yi∗ Harvard University Jiajun Wu∗ MIT CSAIL Chuang Gan MIT-IBM Watson AI Lab Antonio Torralba MIT CSAIL Pushmeet Kohli DeepMind