HyperAIHyperAI
منذ 7 أيام

تجميع الدلالات الهدف من خلال تمثيلات النصوص للتكيف الشامل المقاوم

{Yixin Zhang, Zilei Wang, Weinan He}
الملخص

يُركّز التكيّف النطاقي الشامل (UniDA) على نقل المعرفة من المجال المصدري إلى المجال المستهدف في ظل وجود تغير في المجال (domain shift) ووجود تغير غير معروف في الفئات (unknown category shift). تكمن التحدي الرئيسي في تحديد أمثلة الفئات المشتركة وتوحيدها. تُعتمد الطرق الحالية عادةً على استخلاص مراكز معاني المجال المستهدف من فضاء تمثيل صور مستمر وغير مقيد. وبسبب وجود تغير في المجال وعدد غير معروف للكتل (clusters)، تؤدي هذه المراكز غالبًا إلى خوارزميات توحيد معقدة وقليلة الموثوقية. في هذه الورقة، وباستخدام نماذج الرؤية واللغة (vision-language models)، نبحث عن مراكز معاني في فضاء تمثيل نصي منفصل وذو معنى معنويًا. يضمن الفضاء المقيد وجودًا شبه معدوم للتحيّز النطاقي، بالإضافة إلى حجم معنوي مناسب لهذه المراكز، مما يمكّن من تطوير خوارزمية تكيّف بسيطة وقوية. وتحديدًا، نقترح طريقة TArget Semantics Clustering (TASC) المبنية على التمثيلات النصية، والتي تستخدم تحسين المعلومات كهدف موحد، وتنطوي على مرحلتين. أولاً، وباستخدام مشغلات متجمدة (frozen encoders)، نستخدم إطار عمل يعتمد على بحث جشع (greedy search) للعثور على مجموعة مثلى من التمثيلات النصية التي تمثل المعاني النطاقية المستهدفة. ثانيًا، وبثبات نتائج البحث، نُحسّن المشغلات باستخدام الانحدار التدرجي (gradient descent)، مما يحقق في الوقت نفسه توحيدًا نطاقيًا قويًا وتقسيمًا فرديًا للفئات. بالإضافة إلى ذلك، نقترح دالة تقييم تُسمى Universal Maximum Similarity (UniMS)، مصممة خصيصًا للكشف عن العينات المفتوحة (open-set samples) في سياق UniDA. وقد أجرينا تقييمًا تجريبيًا لقياس شمولية خوارزميات UniDA في أربعة سيناريوهات لتحول الفئات. وتبين النتائج التجريبية الموسعة على أربع معايير (benchmarks) فعالية وقوة منهجنا، حيث حقق أداءً متفوقًا على الحد الأقصى (state-of-the-art).

تجميع الدلالات الهدف من خلال تمثيلات النصوص للتكيف الشامل المقاوم | أحدث الأوراق البحثية | HyperAI