إعادة التفكير في الاضطرابات في المشغلات-المُفكّكات لتدريب سريع

غالبًا ما نستخدم الاضطرابات لتنظيم النماذج العصبية. بالنسبة لنماذج المُشفّر-المُفكّك العصبيّة، طبّقت الدراسات السابقة طرقًا مثل العينة المُجدولة (Bengio et al., 2015) والاضطرابات العدوّية (Sato et al., 2019) كأمثلة على الاضطرابات، لكن هذه الطرق تتطلب وقتًا حسابيًا كبيرًا. وبالتالي، تتناول هذه الدراسة السؤال حول ما إذا كانت هذه الأساليب كافية من حيث الكفاءة من حيث وقت التدريب. نقوم بمقارنة عدة تقنيات اضطرابية في مسائل التحويل التسلسلي (sequence-to-sequence) من حيث الوقت الحسابي المطلوب. تُظهر النتائج التجريبية أن التقنيات البسيطة مثل حذف الكلمات (Gal and Ghahramani, 2016) واستبدال عناصر المدخلات بشكل عشوائي تحقق نتائج مماثلة (أو أفضل) مقارنةً بالاضطرابات المقترحة حديثًا، مع أن هذه الأساليب البسيطة أسرع بكثير. يمكن الوصول إلى الكود الخاص بنا بشكل عام عبر الرابط التالي: https://github.com/takase/rethink_perturbations.