منذ 2 أشهر
نموذج شبكة عصبية هجين للاستدلال الشائع
Pengcheng He; Xiaodong Liu; Weizhu Chen; Jianfeng Gao

الملخص
يقترح هذا البحث نموذج شبكة عصبية هجينة (HNN) للمنطق الشائع. يتكون النموذج الهجين من موديلين فرعيين، وهما نموذج اللغة المقنّع ونموذج التشابه الدلالي، اللذان يشتركان في مشفّر سياقي قائم على BERT ولكن يستخدمان طبقات إدخال وإخراج خاصة بكل نموذج. حقق النموذج الهجين HNN نتائج جديدة رائدة في ثلاث مهمات كلاسيكية للمنطق الشائع، حيث رفع مؤشرWNLI إلى 89%، ومؤشر تحدي Winograd Schema (WSC) إلى 75.1%، ومؤشر PDP60 إلى 90.0%. أظهرت دراسة الاستبعاد أن نماذج اللغة وأنماط التشابه الدلالي هي أساليب مكملة للمنطق الشائع، وأن HNN يجمع بفعالية بين نقاط القوة في كل منها. سيتم توفير الكود والنماذج المدربة مسبقًا بشكل عام على الرابط https://github.com/namisan/mt-dnn.