انحدار مُعاقَبَة مُ-scalable للكشف عن الضوضاء في التعلم بوساطة علامات ضوضائية

عادةً ما يؤدي مجموعة التدريب الضوضائية إلى تدهور التعميم والمتانة في الشبكات العصبية. في هذه الورقة، نقترح استخدام إطار عمل للكشف عن التسميات الضوضائية مدعومًا نظريًا، للكشف عن البيانات الضوضائية وإزالتها في إطار التعلم مع التسميات الضوضائية (LNL). بشكل خاص، نصمم انحدارًا مُعاقبًا لتمثيل العلاقة الخطية بين ميزات الشبكة والتسميات ذات الشكل الواحد (one-hot)، حيث يتم تحديد البيانات الضوضائية من خلال معاملات الانزياح المتوسطة غير الصفرية التي يتم حلها في نموذج الانحدار. ولجعل الإطار قابلاً للتوسع أمام مجموعات بيانات تحتوي على عدد كبير من الفئات والبيانات التدريبية، نقترح خوارزمية تقسيم لتقسيم مجموعة التدريب بأكملها إلى أجزاء صغيرة يمكن حلها بالتوازي باستخدام الانحدار المُعاقب، مما يؤدي إلى إطار عمل الانحدار المُعاقب القابل للتوسع (SPR). ونقدم شرطًا احتماليًا غير تقاربي يضمن قدرة SPR على تحديد البيانات الضوضائية بشكل صحيح. وعلى الرغم من أن SPR يمكن اعتباره وحدة اختيار عينات ضمن نموذج تدريب مراقب قياسي، فإننا نُكمل ذلك بدمجه مع خوارزمية شبه مراقبة للاستفادة بشكل أكبر من الدعم الذي توفره البيانات الضوضائية كبيانات غير مُسمّاة. وأظهرت النتائج التجريبية على عدة مجموعات بيانات معيارية وبيانات واقعية ضوضائية فعالية إطارنا. تم إصدار كودنا والنموذج المُدرّب مسبقًا على الرابط: https://github.com/Yikai-Wang/SPR-LNL.