HyperAIHyperAI

Command Palette

Search for a command to run...

الرجوع التكتيكي: التصحيح الذاتي عبر الرجوع في التنقل البصري واللغوي

Liyiming Ke1∗ Xiujun Li1,2 Yonatan Bisk1 Ari Holtzman1 Zhe Gan2 Jingjing Liu2 Jianfeng Gao2 Yejin Choi1,3 Siddhartha Srinivasa1

الملخص

نقدم نظام التصفح المدرك للحدود مع العودة إلى الوراء (FAST Navigator)، وهو إطار عام لفك تشفير الأفعال، يحقق نتائج متميزة على تحدي التنقل بين الغرف باستخدام الرؤية واللغة (R2R) الذي طرحه أندرسون وآخرون (2018). بالاعتماد على تعليمات اللغة الطبيعية وصور ثلاثية الأبعاد واقعية لمحيط غير معروف سابقًا، كان على الوكيل المهمة بتصفح من الموقع المصدر إلى الموقع الهدف بأسرع وقت ممكن. بينما تقوم جميع النهج الحالية باتخاذ قرارات أفعال محلية أو تقييم المسارات الكاملة باستخدام البحث الشعاعي، فإن نهجنا يوازن بين الإشارات المحلية والعالمية عند استكشاف بيئة غير مشاهدة سابقًا. وبشكل مهم، هذا يسمح لنا بالعمل بطريقة جشعة ولكن استخدام الإشارات العالمية للعودة إلى الوراء عند الحاجة. تطبيق إطار FAST على النماذج المتميزة الحالية حقق زيادة نسبتها 17% بشكل نسبي، وزيادة مطلقة بنسبة 6% في معدل النجاح المرتبط بطول المسار (SPL).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp