تحليل شجرة المكونات ذات الـ N-ary باستخدام نموذج شبه ماركوف تكراري

في هذه الورقة، ندرس مهمة تحليل التركيب القائم على الرسوم البيانية في الإطار الذي لا يتم فيه إجراء عملية التبديل إلى شجرة ثنائية كخطوة ما قبل المعالجة، حيث يمكن أن تتكون شجرة التركيب من عقد ذات أكثر من طفلين. غالبًا ما تُستخدم الأساليب القائمة على الرسوم البيانية في هذا السياق لتجهيز عقد خفية بعلامة وهمية داخل العقد ذات أكثر من طفلين، بهدف تحويل الشجرة إلى شجرة ثنائية للتنبؤ. ولكن هذه الطريقة تعاني من عيب يتمثل في كسر العلاقات بين الأطفال المتجاورين داخل العقدة ذات أكثر من طفلين. ونتيجة لذلك، قد لا يتم نمذجة الاعتماديات بين هذه العناصر المتجاورة بدقة، بل تُهمل فعليًا. لحل هذا التحدي، نقترح إطارًا جديدًا قائمًا على الرسوم البيانية يُسمى "النموذج شبه ماركوف التكراري". الفكرة الأساسية تكمن في استخدام نموذج شبه ماركوف من الدرجة الأولى للتنبؤ بالتسلسل الفوري للعُقد الفرعية المرتبطة بمرشح تركيبي، ثم استخدام هذا التسلسل بشكل تكراري كمرشح فرعي للوالد. وبهذا الشكل، يمكن تمثيل الاعتماديات بين العناصر المتجاورة باستخدام ميزات انتقال من الدرجة الأولى، مما يحل المشكلة المذكورة سابقًا. من خلال التجارب، حقق الإطار المقترح قيم F1 بلغت 95.92% و92.50% على مجموعتي البيانات PTB وCTB 5.1 على التوالي. وبشكل خاص، أظهر النموذج شبه ماركوف التكراري ميزة واضحة في نمذجة العقد ذات أكثر من طفلين، حيث ارتفعت القيمة المتوسطة لـ F1 بنسبة تتراوح بين 0.3 إلى 1.1 نقطة في PTB، وبنسبة تتراوح بين 2.3 إلى 6.8 نقطة في CTB 5.1.