كيف تُنشئ محرك توصية قائم على الرسوم البيانية باستخدام EDG وNeo4j
يُعدّ بناء محرك توصية مبني على الرسوم البيانية خطوة ذكية لاستخراج قيم من البيانات المعقدة، خاصة في السياقات الأكاديمية أو العلمية. في هذا الدليل، يتم عرض طريقة توظيف أداة EDG من شركة TopQuadrant لإدارة التصنيف (Taxonomy) ونشره إلى قاعدة بيانات Neo4j لتمكين محرك توصية ذكي. يعتمد النموذج على فصل البيانات الفعلية (مثل مقالات علمية وهمية) عن الهيكل المفاهيمي (التصنيف التصنيفي للعلوم والهندسة STEM)، مما يسمح باستنتاج علاقات تلقائية من خلال التسلسل الهرمي. تبدأ العملية بتنزيل نسخ تجريبية مجانية من EDG وNeo4j. يُستخدم EDG لإنشاء وصيانة التصنيف الهرمي، حيث يتم استيراد هيكل STEM من ملف ZIP متوفر على GitHub. بعد استيراد التصنيف، يتم تكوين اتصال بين EDG وقاعدة Neo4j عبر إدخال بيانات الاعتماد، ثم نشر التصنيف كمُفاهيم (Concepts) وعلاقات (BROADER) إلى Neo4j. بمجرد اكتمال النشر، يتم استيراد بيانات المقالات (15 مقالًا وهميًا) من ملف CSV إلى Neo4j. يتم تحديد حقل "id" كمفتاح رئيسي، مما يُنشئ 15 عقدة تمثل المقالات. لربط هذه المقالات بالتصنيف، يُستخدم استعلام Cypher لربط كل مقال بفئة محددة عبر علاقة TAGGED_WITH، باستخدام الـ topicUri المذكور في الملف. بعد الربط، يُمكن تطبيق خوارزميات توصية مبنية على الهيكل الهرمي. على سبيل المثال، عند تحليل مقال بعنوان "Advances in Mathematical Software Studies #7"، يُكتشف أنه مُصنف ضمن "Mathematical Software"، التي تُعد فرعًا من "Computer Science". باستخدام استعلام Cypher متقدم، يُمكن اكتشاف مقالات أخرى مُصنفة ضمن فروع أخرى من "Computer Science" (مثل "Computers and Society")، حتى لو لم تُصنف صراحةً بـ "Mathematical Software". يُحسب تقييم التوصية بناءً على عدد التماثلات الهرمية المشتركة، مما يُعزز دقة التوصيات. أحد أبرز المزايا هو المرونة في التحديث. عند رغبة المستخدم في إعادة تصنيف "Mathematical Software" كفرع من "Mathematics" بدلًا من "Computer Science"، يكفي سحبها وإفلاتها في الهيكل داخل EDG، ثم إعادة النشر. فورًا، تُعاد تقييم التوصيات في Neo4j، حيث تُصبح المقالات ذات الصلة بالرياضيات هي الأبرز، دون الحاجة إلى تعديل أي بيانات أو علاقات يدويًا. هذا النموذج يُبرز فوائد الفصل بين إدارة الهيكل المفاهيمي (التي تُدار بفعالية في EDG) وتحليل البيانات (الذي يُنجز بكفاءة في Neo4j). يُمكن تطبيقه في بيئات متعددة، مثل دمج بيانات من SharePoint وAEM، مع الحفاظ على انسجام مفاهيمي عبر الأنظمة. كما يُقلل من مخاطر التحديثات المضنية ويوفر مرونة في تطوير النماذج مع تطور الفهم العلمي. رغم أن الأدوات مُرخصة تجاريًا، فإن الاعتماد على معايير مفتوحة (مثل RDF وSHACL وSPARQL) يُقلل من مخاطر الارتهان للبائع. ومع ذلك، يتطلب هذا النموذج مهارات متعددة (نمذجة المفاهيم، برمجة Cypher) ويتضمن مكونات إضافية، مما يجعله غير مناسب للمستخدمين ذوي الاستخدامات البسيطة. باختصار، يُظهر هذا المشروع كيف يمكن للهياكل المفاهيمية المُدارة بذكاء، مدعومة ببنية رسمية، أن تُحوّل بيانات بسيطة إلى تجربة توصية ذكية، مُنضبطة، وقابلة للتطور مع الزمن.
