HyperAIHyperAI
منذ 11 أيام

ريتوتش داون: إضافة لمسة النهاية إلى ستريت ليرن كمورد قابل للمشاركة للمهام المرتبطة بتثبيت اللغة في مشهد الشارع

Harsh Mehta, Yoav Artzi, Jason Baldridge, Eugene Ie, Piotr Mirowski
ريتوتش داون: إضافة لمسة النهاية إلى ستريت ليرن كمورد قابل للمشاركة للمهام المرتبطة بتثبيت اللغة في مشهد الشارع
الملخص

يُقدّم مجموعة بيانات Touchdown (Chen et al., 2019) تعليمات من قبل مُعلّقين بشريين لتنقل عبر شوارع مدينة نيويورك، ولحلّ التوصيفات المكانية في موقع معين. ولتمكين المجتمع البحثي الأوسع من العمل بكفاءة على مهام Touchdown، نُطلق بشكل عام المجموعة المكوّنة من 29 ألف صورة مُحاكاة لطريق (Street View) الأصلية الضرورية لمهام Touchdown. واتّبعنا نفس الإجراء المستخدم في إصدار بيانات StreetLearn (Mirowski et al., 2019) للتحقق من وجود معلومات شخصية قابلة للتعرف عليها في الصور، ونُعَمّيها عند الحاجة. وقد تم إدراج هذه الصور في مجموعة بيانات StreetLearn، ويمكن الحصول عليها بنفس الطريقة المستخدمة سابقًا في إصدار StreetLearn. كما نقدّم تنفيذًا مرجعيًا لكلٍ من مهام Touchdown: التوجيه البصري واللغوي (VLN)، وحل التوصيفات المكانية (SDR). ونقارن نتائج نموذجنا مع النتائج المذكورة في Chen et al. (2019)، ونُظهر أن الصور التي أضفناها إلى StreetLearn تدعم كليًا مهام Touchdown، ويمكن استخدامها بكفاءة في الأبحاث المستقبلية والمقارنات.

ريتوتش داون: إضافة لمسة النهاية إلى ستريت ليرن كمورد قابل للمشاركة للمهام المرتبطة بتثبيت اللغة في مشهد الشارع | أحدث الأوراق البحثية | HyperAI