التعلم النشط المُعزَّز بالرسم البياني لحل هوية الكيانات متعدد المصادر
تعتمد طرق حل هوية الكيانات المُراقبة على أزواج السجلات المُعلمة لتعلم أنماط التطابق بين مصدرين أو أكثر من المصادر. وتقلل طرق التعلم النشط من جهد التصنيف من خلال اختيار أزواج معلوماتية للتصنيف. تركز جميع الطرق الحالية للتعلم النشط في حل هوية الكيانات على سيناريوهات التطابق بين مصدرين فقط، وتجاهل الإشارات التي توجد فقط في البيئات متعددة المصادر، مثل "شبكة البيانات" (Web of Data). في هذا البحث، نقترح ALMSER، وهي طريقة مدعومة بالرسم البياني للتعلم النشط في حل هوية الكيانات متعددة المصادر. وبما نعلم، فإن ALMSER هي أول طريقة قائمة على التعلم النشط لحل هوية الكيانات مُصممة خصيصًا للبيئات متعددة المصادر. تُستغل ALMSER الرسم البياني الغني للتوافق الموجود في البيئات متعددة المصادر لاختيار أزواج سجلات معلوماتية. علاوة على ذلك، يُستخدم الرسم البياني للتوافق لاستخلاص بيانات تدريب مكملة. وقد قُمنا بتقييم طريقة ALMSER باستخدام خمسة مهام تطابق متعددة المصادر، تختلف في خصائصها المُميزة. وتبين النتائج التجريبية أن الاستفادة من إشارات الرسم البياني تؤدي إلى تحسين النتائج مقارنة بطرق التعلم النشط التي تعتمد على استراتيجيات الاستعلام القائمة على الهامش أو الاستراتيجيات القائمة على اللجنة، من حيث مقياس F1 في جميع المهام.