HyperAIHyperAI
منذ 15 أيام

CLASS: تحسين أداء واسترجاع النص-الجزيئات عبر الوسائط المختلفة وكفاءة التدريب

Hongyan Wu, Peijian Zeng, Weixiong Zheng, Lianxi Wang, Nankai Lin, Shengyi Jiang, Aimin Yang
CLASS: تحسين أداء واسترجاع النص-الجزيئات عبر الوسائط المختلفة وكفاءة التدريب
الملخص

تُعد مهمة استرجاع الجزيئات من النصوص عبر الوسائط المختلفة (Cross-modal text-molecule retrieval) جسرًا يربط بين هياكل الجزيئات والوصف باللغة الطبيعية. تركز الطرق الحالية بشكل رئيسي على محاذاة الوسيط النصي مع الوسيط الجزيئي، لكنها تتجاهل التكيف التدريجي لحالة التعلم في المراحل المختلفة من التدريب وتحسين كفاءة التدريب. ولحل هذه التحديات، نقترح في هذه الورقة إطارًا تدريبيًا مبنيًا على التعلم التدريجي عبر الوسائط (Curriculum Learning-bAsed cross-modal text-molecule training framework، ونُسميه CLASS)، والذي يمكن دمجه مع أي هيكل أساسي (backbone) لتحقيق تحسين ملحوظ في الأداء. بشكل خاص، نقوم بقياس صعوبة العينات مع الأخذ بعين الاعتبار كلا الوسيطين النصي والجزيئي، ونصمم مُنظّم عينات (sample scheduler) يُدخل العينات التدريبية وفق نمط من السهولة إلى الصعوبة مع تقدم التدريب، مما يقلل بشكل ملحوظ من حجم العينات المطلوبة في المراحل المبكرة من التدريب ويعزز كفاءة التدريب. علاوةً على ذلك، نُقدّم تقنية التعلم التكيفي للشدة (adaptive intensity learning) التي تزيد من شدة التدريب تدريجيًا مع تقدم التدريب، مما يتحكم تلقائيًا في شدة التعلم عبر جميع مراحل التعلم التدريجي. أظهرت النتائج التجريبية على مجموعة بيانات ChEBI-20 أداءً متفوقًا لطريقتنا، مع تحقيق وفورات كبيرة في الوقت في آنٍ واحد.

CLASS: تحسين أداء واسترجاع النص-الجزيئات عبر الوسائط المختلفة وكفاءة التدريب | أحدث الأوراق البحثية | HyperAI