HyperAIHyperAI
منذ 17 أيام

تدريب من الطرف إلى الطرف لقارئ متعدد المستندات ومرتّب لأسئلة المجال المفتوح

Devendra Singh Sachan, Siva Reddy, William Hamilton, Chris Dyer, Dani Yogatama
تدريب من الطرف إلى الطرف لقارئ متعدد المستندات ومرتّب لأسئلة المجال المفتوح
الملخص

نقدم طريقة تدريب قابلة للتفاضل من الطرف إلى الطرف لأنظمة الإجابة على الأسئلة في المجال المفتوح المدعومة باسترجاع المعلومات، والتي تدمج المعلومات من وثائق مسترجعة متعددة عند إنتاج الإجابات. نُمَثّل قرارات الاسترجاع كمتغيرات خفية على مجموعات من الوثائق ذات الصلة. وبما أن التكامل على مجموعات من الوثائق المسترجعة يُعد عملية حسابية صعبة، فإننا نُقَرّب هذه العملية باستخدام خوارزمية التوقع-التحديث (Expectation-Maximization). نقوم بتقدير تدريجي لقيمة المتغير الخفي (مجموعة الوثائق ذات الصلة لسؤال معين)، ثم نستخدم هذا التقدير لتحديث معاملات مُسترجع الوثائق (retriever) ومحرّر النص (reader). ونفترض أن هذا التدريب من الطرف إلى الطرف يُمكّن إشارات التدريب من التدفق نحو المُقرأ ثم نحو المسترجع بشكل أفضل من التدريب المتسلسل (staged-wise). هذا يؤدي إلى مسترجع قادر على اختيار وثائق أكثر صلة بالسؤال، ومُقرأ مدرب على وثائق أكثر دقة لتقديم إجابة دقيقة. وقد أظهرت التجارب على ثلاث مجموعات معيارية أن الطريقة المقترحة تتفوق على جميع النهج الحالية ذات الحجم المماثل بنسبة 2-3% في نقاط المطابقة الحرفية المطلقة، محققةً نتائجًا جديدة على مستوى الحالة الحالية (state-of-the-art). كما تُظهر نتائجنا إمكانية تعلّم الاسترجاع بهدف تحسين إنتاج الإجابات دون الحاجة إلى توجيه صريح لقرارات الاسترجاع.

تدريب من الطرف إلى الطرف لقارئ متعدد المستندات ومرتّب لأسئلة المجال المفتوح | أحدث الأوراق البحثية | HyperAI