HyperAIHyperAI
منذ 2 أشهر

تعلم التمثيلات المتقطعة عبر التدريب الذاتي المُكثف للمعلومات

Weihua Hu; Takeru Miyato; Seiya Tokui; Eiichi Matsumoto; Masashi Sugiyama
تعلم التمثيلات المتقطعة عبر التدريب الذاتي المُكثف للمعلومات
الملخص

تعلم التمثيلات المنفصلّة للبيانات هو مهمة مركزية في تعلم الآلة بسبب اقتضاب هذه التمثيلات وسهولة تفسيرها. تشمل هذه المهمة الحustering والتعلم التجزيئي كحالات خاصة. تعد الشبكات العصبية العميقة واعدة للاستخدام لأنها يمكن أن تُنمذِج عدم الخطي في البيانات وتتناسب مع مجموعات بيانات كبيرة. ومع ذلك، فإن تعقيد نموذجها كبير للغاية، ولذلك يجب علينا تنظيم الشبكات بعناية من أجل تعلم تمثيلات مفيدة تظهر الثباتية المقصودة لتطبيقات معينة. لتحقيق هذا الهدف، نقترح طريقة تسمى "تدريب الذاتي القائم على زيادة المعلومات" (Information Maximizing Self-Augmented Training - IMSAT). في IMSAT، نستخدم زيادة البيانات لإلزام الثباتية على التمثيلات المنفصلّة. بشكل أكثر تحديدًا، نشجع التمثيلات المتوقعة لنقاط البيانات المعززة على أن تكون قريبة من تلك الخاصة بنقاط البيانات الأصلية بطريقة شاملة ومتكاملة. وفي الوقت نفسه، نقوم بتعظيم الارتباط النظري للمعلومات بين البيانات والتمثيلات المنفصلّة المتوقعة لها. أظهرت التجارب الواسعة على مجموعات بيانات معيارية أن IMSAT ينتج نتائج رائدة في مجال الحustering والتعلم التجزيئي غير المشرف.注释:- "clustering" 翻译为 "الحustering",因为这是常见的术语,但为了保持专业性和完整性,建议在首次出现时使用括号标注原文。- "unsupervised hash learning" 翻译为 "التعلم التجزيئي غير المشرف"。