Command Palette
Search for a command to run...
ملف التوبولوجيا الجزيئية (MOLTOP) - أساس بسيط وقوي لتصنيف رسوميات الجزيئات
ملف التوبولوجيا الجزيئية (MOLTOP) - أساس بسيط وقوي لتصنيف رسوميات الجزيئات
Wojciech Czech Jakub Adamczyk
الملخص
نعيد النظر في فعالية الوصفات الطوبولوجية لتصنيف رسوم المolecular، ونصمم قاعدة بسيطة ولكن قوية. نُظهر أن نهجًا بسيطًا في هندسة الميزات – باستخدام تجميع التكرار (histogram aggregation) للوصفات الحافة، والترميز الواحد-لكل-واحد (one-hot encoding) لأرقام الذرات وأنواع الروابط – عند دمجه مع فئة تصنيف Random Forest، يمكنه إقامة قاعدة قوية لشبكات التعلم العصبي الرسومية (GNNs). يُعد الخوارزمية الجديدة، المعروفة بـ Molecular Topological Profile (MOLTOP)، مُدمجة لمؤشرات مركزية الحافة (Edge Betweenness Centrality)، ومؤشر راند المُعدّل (Adjusted Rand Index)، ودرجة التشابه الهيكلي (SCAN Structural Similarity Score). تُثبت هذه الطريقة كفاءة ملحوظة مقارنة بالشبكات الحديثة من GNNs، مع الحفاظ على بساطتها، وسرعتها، وانخفاض تباينها، وانعدام الحاجة إلى ضبط المعلمات (hyperparameter-free). تم اختبار منهجنا بدقة على مجموعات بيانات MoleculeNet باستخدام بروتوكول تقييم عادل مقدّم من Open Graph Benchmark. كما نُظهر قدرة التوليد خارج المجال (out-of-domain) في مهمة تصنيف الببتيدات من Long Range Graph Benchmark. تُظهر التقييمات عبر أحد عشر مجموعة معايير أن MOLTOP تمتلك قدرات تمييزية قوية، وتتفوّق على اختبار 1-WL وحتى اختبار 3-WL لبعض فئات الرسوم. نستنتج أن القواعد القائمة على الوصفات، مثل التي نقترحها، لا تزال حاسمة لتقييم دقيق للتقدم المحرز في مجال GNNs.