HyperAIHyperAI
منذ 7 أيام

شبكات التوصية اللامحدودة: نهج يركّز على البيانات

Noveen Sachdeva, Mehak Preet Dhaliwal, Carole-Jean Wu, Julian McAuley
شبكات التوصية اللامحدودة: نهج يركّز على البيانات
الملخص

نستفيد من نواة التماثل العصبي (Neural Tangent Kernel) وتكافؤها مع تدريب الشبكات العصبية ذات العرض اللانهائي لتصميم نموذج الترميز التلقائي بطبقة ضيقة ذات عرض لانهائي، والذي يُعرف بـ $\infty$-AE. النتيجة هي نموذج توصية ذا تعبير عالٍ ولكن بسيط، يحتوي على معلمة فائقة واحدة وحل مغلق الشكل. وباستخدام بساطة نموذج $\infty$-AE، نطور أيضًا تقنية Distill-CF لتكوين ملخصات بيانات صغيرة جدًا وعالية الدقة، تُستخلص المعرفة الأكثر أهمية من مصفوفة تفاعلات المستخدمين مع العناصر، والتي تكون ضخمة جدًا ونادرة التكرار، بهدف استخدام فعّال ودقيق للبيانات لاحقًا في مهام مثل تدريب النماذج، الاستنتاج، أو البحث عن الهياكل المعمارية. يعتمد هذا النهج على منظور مركّز حول البيانات، حيث نسعى إلى تحسين جودة بيانات التغذية المرتدة المسجلة من المستخدمين لاستخدامها في النماذج اللاحقة، بغض النظر عن خوارزمية التعلم المستخدمة. ونستخدم بشكل خاص مفهوم عينة جومبل القابلة للتفاضل (differentiable Gumbel-sampling) لمعالجة التباين الطبيعي في البيانات، والندرة، والطبيعة شبه المُنظَّمة، مع الحفاظ على قابلية التوسع لبيانات تحتوي على مئات الملايين من تفاعلات المستخدمين مع العناصر. وقد أظهرت النهجان المقترحان أداءً متفوقًا بشكل كبير مقارنة بأفضل النماذج الحالية في مجالهما، وعند استخدامهما معًا، تم تحقيق أداء يبلغ 96-105% من أداء $\infty$-AE على البيانات الكاملة، باستخدام ما لا يزيد عن 0.1% من حجم البيانات الأصلي، ما يدفعنا إلى طرح سؤال مُدهِش: هل تحتاج بالفعل إلى كميات أكبر من البيانات لتحقيق توصيات أفضل؟

شبكات التوصية اللامحدودة: نهج يركّز على البيانات | أحدث الأوراق البحثية | HyperAI