HyperAIHyperAI
منذ 11 أيام

تعلم تمثيلات متعددة الدقة لأنماط البحث في الشبكات الببليوغرافية

{Jason J. Jung, Hyeon-Ju Jeon, O-Joun Lee}
الملخص

تهدف هذه الدراسة إلى تمثيل أنماط الأبحاث الخاصة بالكيانات الببليوغرافية (مثل الباحثين، والورقات، والمناسبات) باستخدام متجهات ذات طول ثابت. إن الهياكل الشبكية الببليوغرافية المبنية على هذه الكيانات تكون متنوعة بشكل كبير، ويزداد هذا التنوع لدى الكيانات البارزة. وبالتالي، وعلى الرغم من حجمها الكبير، تحصل الكيانات البارزة على فرص تعلّم محدودة، بينما تُمثّل الكيانات ذات الأداء المنخفض بشكل مفرط. لحل هذه المشكلة، تتمثّل الدراسة في تمثيل أنماط الكيانات بدلًا من تصوير كل كيان بشكل دقيق. أولاً، نصف الهياكل المبنية على الكيانات باستخدام عملية إعادة التسمية ويسفيلاير-ليهمن (WL). توفر كل شبكة فرعية ناتجة عن عملية إعادة التسمية معلومات حول الباحثين، وأنواع الورقات التي نشروا، ومستوى المعايير في المناسبات التي نُشرت فيها هذه الورقات، وأنواع زملائهم في التعاون. ونفترض أن كل شبكة فرعية تمثل أنماط البحث الخاصة بالكيانات الببليوغرافية، مثل تفضيل باحث ما بين عدد قليل من الورقات ذات تأثير كبير أو عدد كبير من الورقات ذات تأثير متوسط. ثم، نبسّط الشبكات الفرعية وفقًا لمستويات متعددة من التفصيل. تمثل الشبكات الفرعية الأصلية الفريدية الخاصة بالكيانات، بينما تمثل الشبكات الفرعية المبسطة الكيانات التي تشترك في نفس أنماط البحث. بالإضافة إلى ذلك، توازن الشبكات الفرعية المبسطة فرص التعلّم بين الكيانات عالية الأداء ومنخفضة الأداء من خلال تواجدها مع كلا النوعين من الكيانات. نُطبّق طريقة سكيب-غرام (Skip-Gram) لتمثيل الشبكات الفرعية. وإذا كانت نتائج التمثيل تعكس أنماط البحث الخاصة بالكيانات، فإن المتجهات الناتجة ينبغي أن تكون قادرة على تمثيل جوانب متعددة للأداء البحثي على المدى القصير والطويل، بغض النظر عن مستوى أداء الكيانات. ولهذا، أجرينا تجارب للتنبؤ بـ 23 مؤشرًا للأداء خلال أربع فترات زمنية، لثلاث مجموعات أداء (أفضل 1%، 5%، 10%، وجميع الكيانات)، باستخدام فقط تمثيلات المتجهات. وقد أظهر النموذج المقترح أداءً أفضل من طرق التمثيل الشبكي الحالية من حيث الدقة والانحراف المعياري.

تعلم تمثيلات متعددة الدقة لأنماط البحث في الشبكات الببليوغرافية | أحدث الأوراق البحثية | HyperAI