اكتشاف العلاقات البصرية باستخدام التقطير المعرفي الداخلي والخارجي للغة

فهم العلاقات البصرية يتضمن تحديد الموضوع والكائن والمفترض الذي يربط بينهما. نستفيد من الارتباطات القوية بين المفترض والزوج (الموضوع، الكائن) (سواءً على المستوى الدلالي أو المكاني) لتنبؤ المفترضات بناءً على الموضوعات والكائنات. نمذجة الثلاثة كيانات معًا تعكس علاقاتهم بشكل أكثر دقة، لكنها تزيد من التعقيد في التعلم نظرًا لكون مساحة المعنى للعلاقات البصرية ضخمة وبيانات التدريب محدودة، خاصة بالنسبة للعلاقات ذات الذيل الطويل التي تحتوي على عدد قليل من الحالات. لتجاوز هذا العائق، نستخدم معرفة الإحصائيات اللغوية لتقييد تعلم النموذج البصري. نحصل على المعرفة اللغوية بتعدين البيانات من كل من شروح التدريب (المعرفة الداخلية) ومن النصوص المتاحة للعامة، مثل ويكيبيديا (المعرفة الخارجية)، وحساب توزيع الاحتمال الشرطي لمفترض معين بناءً على الزوج (الموضوع، الكائن). ثم، نقوم بتقريب هذه المعرفة إلى نموذج عميق لتحقيق تعميم أفضل. تشير نتائج التجارب لدينا على مجموعتي بيانات "كشف العلاقات البصرية" (VRD) و"جينوم البصر" إلى أن نموذجنا يتفوق بشكل كبير على الأساليب الرائدة حاليًا بفضل تقريب المعرفة اللغوية هذا، وخاصة عند التنبؤ بالعلاقات غير المرئية سابقًا (على سبيل المثال، ارتفعت نسبة الاسترجاع من 8.45٪ إلى 19.17٪ في مجموعة اختبار VRD بدون أمثلة سابقة).