تعلم من بيانات الويب باستخدام وحدة ذاكرة ذاتية التنظيم

لقد جذب التعلم من بيانات الويب اهتمامًا بحثيًا كبيرًا في السنوات الأخيرة. ومع ذلك، فإن الصور التي تم الزحف إليها من الويب غالبًا ما تحتوي على نوعين من الضوضاء: ضوضاء التسمية وضوضاء الخلفية، مما يضيف صعوبات إضافية في استخدامها بكفاءة. تعتمد معظم الطرق الحالية إما على الرقابة البشرية أو تتجاهل ضوضاء الخلفية. في هذا البحث، نقترح طريقة جديدة قادرة على التعامل مع هذين النوعين من الضوضاء معًا، دون الحاجة إلى رقابة صور نظيفة خلال مرحلة التدريب. بشكل خاص، نصيغ طريقتنا ضمن إطار التعلم متعدد الحالات عن طريق تجميع ROIs (أي الصور ومقترحاتها الإقليمية) من نفس الفئة في أكياس. يتم تعيين أوزان مختلفة لـ ROIs في كل كيس بناءً على درجات تمثيل/تمييز أقرب مجموعات لها، حيث يتم الحصول على هذه المجموعات ودرجاتها عبر وحدة الذاكرة المصممة لدينا. يمكن دمج وحدة الذاكرة الخاصة بنا بشكل طبيعي مع وحدة التصنيف، مما يؤدي إلى نظام قابل للتدريب من النهاية إلى النهاية. تُظهر التجارب الشاملة على أربعة مجموعات بيانات مرجعية فعالية طريقتنا.注释:- "ROIs" 翻译为 "ROIs" 并在首次出现时解释为 "أي الصور ومقترحاتها الإقليمية" (Regions of Interest)。- "multi-instance learning" 翻译为 "التعلم متعدد الحالات"。- "end-to-end trainable system" 翻译为 "نظام قابل للتدريب من النهاية إلى النهاية"。