HyperAIHyperAI

Command Palette

Search for a command to run...

ريتوتش داون: إضافة لمسة النهاية إلى ستريت ليرن كمورد قابل للمشاركة للمهام المرتبطة بتثبيت اللغة في مشهد الشارع

Harsh Mehta Yoav Artzi Jason Baldridge Eugene Ie Piotr Mirowski

الملخص

يُقدّم مجموعة بيانات Touchdown (Chen et al., 2019) تعليمات من قبل مُعلّقين بشريين لتنقل عبر شوارع مدينة نيويورك، ولحلّ التوصيفات المكانية في موقع معين. ولتمكين المجتمع البحثي الأوسع من العمل بكفاءة على مهام Touchdown، نُطلق بشكل عام المجموعة المكوّنة من 29 ألف صورة مُحاكاة لطريق (Street View) الأصلية الضرورية لمهام Touchdown. واتّبعنا نفس الإجراء المستخدم في إصدار بيانات StreetLearn (Mirowski et al., 2019) للتحقق من وجود معلومات شخصية قابلة للتعرف عليها في الصور، ونُعَمّيها عند الحاجة. وقد تم إدراج هذه الصور في مجموعة بيانات StreetLearn، ويمكن الحصول عليها بنفس الطريقة المستخدمة سابقًا في إصدار StreetLearn. كما نقدّم تنفيذًا مرجعيًا لكلٍ من مهام Touchdown: التوجيه البصري واللغوي (VLN)، وحل التوصيفات المكانية (SDR). ونقارن نتائج نموذجنا مع النتائج المذكورة في Chen et al. (2019)، ونُظهر أن الصور التي أضفناها إلى StreetLearn تدعم كليًا مهام Touchdown، ويمكن استخدامها بكفاءة في الأبحاث المستقبلية والمقارنات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
ريتوتش داون: إضافة لمسة النهاية إلى ستريت ليرن كمورد قابل للمشاركة للمهام المرتبطة بتثبيت اللغة في مشهد الشارع | مستندات | HyperAI