HyperAIHyperAI
منذ 17 أيام

انزلاقات: مجموعة بيانات للانزلاقات التوزيعية الحقيقية عبر مهام كبيرة متعددة

Andrey Malinin, Neil Band, Ganshin, Alexander, German Chesnokov, Yarin Gal, Mark J. F. Gales, Alexey Noskov, Andrey Ploskonosov, Liudmila Prokhorenkova, Ivan Provilkov, Vatsal Raina, Vyas Raina, Roginskiy, Denis, Mariya Shmatova, Panos Tigas, Boris Yangel
انزلاقات: مجموعة بيانات للانزلاقات التوزيعية الحقيقية عبر مهام كبيرة متعددة
الملخص

تم إجراء أبحاث مهمة لتطوير طرق تحسين المقاومة للانزياح التوزيعي وتقدير عدم اليقين. وعلى النقيض من ذلك، تم استكشاف عدد محدود من الدراسات التي تهدف إلى تطوير مجموعات بيانات قياسية ومقاييس لتقييم هذه الأساليب. علاوةً على ذلك، يركّز معظم الأبحاث المتعلقة بتقدير عدم اليقين والمقاومة على تطوير تقنيات جديدة تعتمد على مهام صغيرة الحجم في الانحدار أو تصنيف الصور. ومع ذلك، تمتلك العديد من المهام ذات الأهمية العملية أنماطًا مختلفة، مثل البيانات الجدولية، أو الصوت، أو النصوص، أو بيانات الاستشعار، والتي تفرض تحديات كبيرة تتعلق بالانحدار والتوقعات الهيكلية المنفصلة أو المستمرة. وبالتالي، بالنظر إلى الحالة الحالية للمجال، أصبح من الضروري توفر مجموعة بيانات معيارية كبيرة الحجم تتضمن مهامًا متعددة عبر طيف من الأنماط المتأثرة بالانزياحات التوزيعية. وسوف تتيح هذه المجموعة للباحثين تقييمًا معنويًا للعديد من أساليب تقدير كمّية عدم اليقين التي تم تطويرها حديثًا، فضلاً عن معايير التقييم والأساليب الأساسية المتطورة. في هذا العمل، نقترح مجموعة بيانات "Shifts" لتقييم تقديرات عدم اليقين والمقاومة للانزياح التوزيعي. وتشكل هذه المجموعة، التي تم جمعها من مصادر وخدمات صناعية، ثلاث مهام، كل منها يتوافق مع نوع معين من الأنماط البياناتية: توقع الطقس باستخدام البيانات الجدولية، والترجمة الآلية، وتوقع حركة المركبات في السيارات ذاتية القيادة (SDC). وجميع هذه الأنماط البياناتية والمهام متأثرة بانزياحات توزيعية حقيقية، "في البيئة الطبيعية"، وتفرض تحديات مثيرة للاهتمام فيما يتعلق بتقدير عدم اليقين. وفي هذا العمل، نقدم وصفًا لمجموعة البيانات، ونتائج أساسية لجميع المهام.

انزلاقات: مجموعة بيانات للانزلاقات التوزيعية الحقيقية عبر مهام كبيرة متعددة | أحدث الأوراق البحثية | HyperAI