HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم المراسلة الضوضائية مع تخفيف الأخطاء الذاتية التعزيزية

Zhuohang Dang Minnan Luo Chengyou Jia Guang Dai Xiaojun Chang Jingdong Wang

الملخص

الاسترجاع عبر الأنظمة الحسية يعتمد على مجموعات بيانات كبيرة ومتناسقة بشكل جيد، والتي تكون في الممارسة صعبة الإعداد. مؤخرًا، لتخفيض تكلفة جمع البيانات، يتم حصاد أزواج متزامنة تلقائيًا من الإنترنت للتدريب. ومع ذلك، فإن هذا الأسلوب يشمل حتماً أزواجًا غير متناسقة، أي التوافق الضوضائي، مما يقوض موثوقية الرقابة ويقلل من الأداء. الطرق الحالية تستفيد من تأثير الذاكرة في الشبكات العصبية العميقة لمعالجة التوافق الضوضائي، والذي يركز بثقة زائدة على \emph{التدريب المستند إلى التشابه مع النفي الصعب} ويعاني من أخطاء تعزيز الذات. بناءً على ما سبق، نقدم إطارًا جديدًا لتعلم التوافق الضوضائي، وهو إطار \textbf{S}elf-\textbf{R}einforcing \textbf{E}rrors \textbf{M}itigation (SREM). تحديداً، من خلال اعتبار توافق العينات كمهام تصنيف داخل الدفعة (batch)، نولد قيم التصنيف للعينة المعطاة. بدلاً من درجة تشابه واحدة، نقوم بتحسين تصفية العينات باستخدام عدم اليقين الطاقي ونقدر حساسية النموذج للعينات النظيفة المختارة باستخدام انتروبيا التصنيف المتبادلة، مع مراعاة توزيع التنبؤ الكلي. بالإضافة إلى ذلك، نقترح التعلم المكمل المتحيز عبر الأنظمة الحسية للاستفادة من التطابقات السلبية التي يتم تجاهلها في التدريب بالنفي الصعب، مما يحسن استقرار تحسين النموذج ويحد من أخطاء تعزيز الذات. التجارب الواسعة على مقاييس صعبة تؤكد فعالية وكفاءة SREM.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp