IPC: مجموعة بيانات مرجعية للتعلم باستخدام البيانات ذات الهيكل الرسومي

المجموعات البيانات المرجعية هي عنصر لا غنى عنه في تقييم طرق التعلم الآلي القائمة على الرسوم البيانية. نحن نطلق مجموعة بيانات جديدة، تم تجميعها من مسابقات التخطيط الدولية (IPC)، لاستخدامها كمرجع في تصنيف الرسوم البيانية، والتقدير الخطي،及相关任务。除了基于人工智能规划问题的图表构建本身就很有趣之外,该数据集还具有与常用基准截然不同的特征。这个名为 IPC 的数据集包含两个独立的版本,即基础版和提升版,这两个版本都包括大小不一且分布偏斜的图表,这对诸如图核和图神经网络等图形模型的计算提出了重大挑战。此数据集中的图表是有向的,而提升版则是无环的,这为有向(无环)结构的专业模型提供了基准测试的机会。此外,图表生成器和标签都是通过计算机编程实现的;因此,如果需要更大规模的数据集,可以轻松扩展。该数据集可从 \url{https://github.com/IBM/IPC-graph-data} 获得。修正后的翻译:مجمّعات البيانات القياسية هي عنصر أساسي لا يمكن الاستغناء عنه في تقييم طرق التعلم الآلي القائمة على الرسوم البيانية. نقوم بإطلاق مجموعة بيانات جديدة، تم جمعها من مسابقات التخطيط الدولية (International Planning Competitions - IPC)، لاستخدامها كمرجع في تصنيف الرسوم البيانية، والتقدير الخطي، ومهام ذات صلة. بالإضافة إلى أن بناء الرسوم البيانية (الذي يعتمد على مشكلات التخطيط الذكائي) هو بحد ذاته مثير للاهتمام، فإن هذه المجموعة البيانات تتميز بخصائص مختلفة تماماً عن المعايير الشائعة المستخدمة. تتكون هذه المجموعة البيانات التي أُطلقت عليها اسم IPC من نسختين مستقلتين: النسخة الأرضية (grounded) والنسخة المُرتفعة (lifted)، وكلاهما يشمل رسوم بيانية كبيرة الحجم وموزعة بشكل غير متوازن، مما يشكل تحدياً كبيراً للحسابات المتعلقة بالرسوم البيانية مثل نوى الرسوم البيانية (graph kernels) وشبكات العصبونات الرسمية (graph neural networks). تحتوي الرسوم البيانية في هذه المجموعة على اتجاهات، وتعتبر النسخة المرتفعة خالية من الحلقات (acyclic)، مما يوفر فرصة لاختبار النماذج المتخصصة للهيكل الموجه (غير الدائري). علاوة على ذلك، يتم إنشاء مولد الرسم البياني وتضمين العلامات بواسطة البرمجة الحاسوبية؛ وبالتالي يمكن توسيع نطاق هذه المجموعة البيانات بسهولة إذا كان هناك رغبة في الحصول على حجم أكبر. يمكن الوصول إلى هذه المجموعة البيانات من خلال الرابط \url{https://github.com/IBM/IPC-graph-data}.