خارج التوزيع
يعد اكتشاف البيانات خارج التوزيع (OOD) اتجاهًا بحثيًا رئيسيًا في مجال التعلم الآلي، والذي يركز على تحديد عينات البيانات التي لم يتم تغطيتها أثناء مرحلة تدريب النموذج. وتعتبر تقنيات الكشف هذه ضرورية لتحسين قوة النماذج، خاصة عندما قد تواجه النماذج بيئات جديدة تختلف بشكل كبير عن بيانات التدريب. التحدي الأساسي في اكتشاف OOD هو أن النموذج يجب أن يكون قادرًا على الاستجابة بشكل صحيح عند مواجهة بيانات غير معروفة أو غير طبيعية، بدلاً من تقديم تنبؤات عمياء. قد تأتي هذه العينات غير المعروفة من توزيعات مختلفة تمامًا أو لها خصائص مختلفة عن بيانات التدريب، مما يتطلب من النموذج أن يتمتع بقدرة تعميم معينة.
في التطبيقات الفعلية، يتوفر لكشف OOD مجموعة واسعة من سيناريوهات التطبيق، بما في ذلك على سبيل المثال لا الحصر التشخيص الطبي، وتقييم المخاطر المالية، والقيادة الذاتية، وما إلى ذلك. في هذه المجالات، يمكن أن يكون لقرارات النموذج عواقب كبيرة، لذا فإن القدرة على تحديد عينات OOD ومعالجتها بدقة تصبح مهمة بشكل خاص. على سبيل المثال، في التشخيص الطبي، قد يواجه النموذج حالات نادرة قد لا تظهر أبدًا في بيانات التدريب، وقد يؤدي الفشل في تحديد عينات OOD هذه بشكل صحيح إلى تشخيص غير صحيح.
نشرت جامعة شنغهاي جياو تونغ ومختبر علي بابا تونغي ورقة بحثية في عام 2024 بعنوان "تضمين المسار للكشف عن خارج التوزيع في التفكير الرياضي"، والتي تم قبولها من قبل NeurIPS 2024، هي أول نتيجة بحثية حول الكشف خارج التوزيع في سيناريوهات التفكير الرياضي.