تعلم المراسلة الضوضائية مع تخفيف الأخطاء الذاتية التعزيزية

الاسترجاع عبر الأنظمة الحسية يعتمد على مجموعات بيانات كبيرة ومتناسقة بشكل جيد، والتي تكون في الممارسة صعبة الإعداد. مؤخرًا، لتخفيض تكلفة جمع البيانات، يتم حصاد أزواج متزامنة تلقائيًا من الإنترنت للتدريب. ومع ذلك، فإن هذا الأسلوب يشمل حتماً أزواجًا غير متناسقة، أي التوافق الضوضائي، مما يقوض موثوقية الرقابة ويقلل من الأداء. الطرق الحالية تستفيد من تأثير الذاكرة في الشبكات العصبية العميقة لمعالجة التوافق الضوضائي، والذي يركز بثقة زائدة على \emph{التدريب المستند إلى التشابه مع النفي الصعب} ويعاني من أخطاء تعزيز الذات. بناءً على ما سبق، نقدم إطارًا جديدًا لتعلم التوافق الضوضائي، وهو إطار \textbf{S}elf-\textbf{R}einforcing \textbf{E}rrors \textbf{M}itigation (SREM). تحديداً، من خلال اعتبار توافق العينات كمهام تصنيف داخل الدفعة (batch)، نولد قيم التصنيف للعينة المعطاة. بدلاً من درجة تشابه واحدة، نقوم بتحسين تصفية العينات باستخدام عدم اليقين الطاقي ونقدر حساسية النموذج للعينات النظيفة المختارة باستخدام انتروبيا التصنيف المتبادلة، مع مراعاة توزيع التنبؤ الكلي. بالإضافة إلى ذلك، نقترح التعلم المكمل المتحيز عبر الأنظمة الحسية للاستفادة من التطابقات السلبية التي يتم تجاهلها في التدريب بالنفي الصعب، مما يحسن استقرار تحسين النموذج ويحد من أخطاء تعزيز الذات. التجارب الواسعة على مقاييس صعبة تؤكد فعالية وكفاءة SREM.