كسر حواجز إعادة التجميع في التجميع العميق القائم على المركزيات

يقوم هذا العمل بدراسة ظاهرة مهمة في خوارزميات التجميع العميقة القائمة على المركز (DC): أداء هذه الخوارزميات يشبع بسرعة بعد فترة من المكاسب المبكرة السريعة. عادة ما يتعامل الممارسون مع التشبع المبكر من خلال إعادة التجميع الدورية، والتي نثبت أنها غير كافية لمعالجة توقف الأداء. نطلق على هذه الظاهرة اسم "حاجز إعادة التجميع" ونظهر بشكل تجريبي متى يحدث حاجز إعادة التجميع، وما هي الآليات الأساسية التي تقف وراءه، وكيف يمكن كسر حاجز إعادة التجميع باستخدام خوارزميتنا BRB. تتجنب خوارزمية BRB التعهد المبكر الزائد للتجمعات الأولية وتتيح التكيف المستمر مع أهداف التجميع المعاد تهيئتها بينما تظل بسيطة مفهومياً. عند تطبيق خوارزميتنا على خوارزميات التجميع العميقة القائمة على المركز الأكثر استخداماً، نوضح أن (1) BRB تحسن الأداء باستمرار عبر مجموعة واسعة من مقاييس التجميع، (2) BRB تمكّن من التدريب من الصفر، و(3) BRB تنافس بشكل قوي مع أفضل خوارزميات DC الحالية عند الجمع بينها وبين الخسارة المقارنة. نوفر رمزنا وموديلاتنا المدربة مسبقاً على الرابط https://github.com/Probabilistic-and-Interactive-ML/breaking-the-reclustering-barrier .