HyperAIHyperAI
منذ 2 أشهر

الغموض في التحسين الهيكلي وتحيز البساطة في استقراء القواعد اللغوية العصبية بدون إشراف

Jinwook Park; Kangil Kim
الغموض في التحسين الهيكلي وتحيز البساطة في استقراء القواعد اللغوية العصبية بدون إشراف
الملخص

لقد ساهم الترميز العصبي بشكل كبير في تقدم استقراء القواعد غير المراقب. ومع ذلك، فإن تدريب هذه النماذج باستخدام خسارة الاحتمالية التقليدية لجميع التحليلات الممكنة يزيد من مشكلتين: 1) $\textit{الغموض في الأمثلية الهيكلية}$ (structural optimization ambiguity)، حيث يتم اختيار واحد من بين القواعد البصرية المثلى التي تتسم بالغموض الهيكلي بشكل تعسفي رغم وجود تفضيل محدد للتحليلات الذهبية، و2) $\textit{التحيز نحو البساطة الهيكلية}$ (structural simplicity bias)، مما يؤدي إلى عدم الاستفادة الكافية من القواعد لتكوين أشجار التحليل. هذه التحديات تعرض استقراء القواعد العصبية غير المراقبة (UNGI) للأخطاء التنبؤية الحتمية، والتباين العالي، والضرورة لاستخدام قواعد موسعة لتحقيق تنبؤات دقيقة. يقدم هذا البحث حلاً لهذه المشكلات، حيث يقوم بتحليل شامل لأصولها. كحل، نقدم $\textit{تركيز التحليل جملة بجملة}$ (sentence-wise parse-focusing) لتقليل مجموعة التحليلات لكل جملة عند تقييم الخسارة، باستخدام التحيز الهيكلي من مفسرات تم تدريبها مسبقًا على نفسASET). في اختبارات المعايير القياسية للاستقراء غير المراقب، طريقة عملنا تحسن الأداء بشكل كبير بينما تعمل على تقليل التباين والتحيز نحو التحليلات البسيطة جدًا. يعزز بحثنا عملية تعلم قواعد أكثر اقتصادًا ودقة وتوافقًا، مما يسهل الفهم الأفضل.请注意,最后一句中的“ASET”可能是原文中的笔误,根据上下文推测应该是“البيانات”(al-bayanat)。如果这是正确的,请允许我进行如下修正:يسهل الفهم الأفضل للبيانات.这使得句子更加通顺和符合阿拉伯语的表达习惯。如果您确认这是正确的,请告知我。