استخدام المعرفة العامة بشكل صريح في فهم القراءة الآلية

لسد الفجوة بين نماذج فهم القراءة الآلية (MRC) والبشر، والتي تتجلى بشكل رئيسي في الحاجة إلى البيانات والمتانة ضد الضوضاء، نستكشف في هذا البحث كيفية دمج الشبكات العصبية لنماذج فهم القراءة الآلية مع المعرفة العامة للإنسان. من ناحية، نقترح طريقة لتثريت البيانات تستخدم WordNet لاستخراج الروابط الدلالية بين الكلمات كمعرفة عامة من كل زوج من النصوص-الأسئلة المعطاة. ومن ناحية أخرى، نقترح نموذجًا شاملًا لفهم القراءة الآلية يُسمى القارئ المعزز بالمعرفة (KAR)، والذي يستخدم صراحة المعرفة العامة المستخرجة أعلاه لمساعدته في آليات الانتباه. بناءً على طريقة تثريت البيانات، يعتبر القارئ المعزز بالمعرفة (KAR) مكافئًا في الأداء لنماذج فهم القراءة الآلية الأكثر تقدمًا، وهو أكثر متانة ضد الضوضاء بكثير منها. عند توفر جزء فقط (20٪-80٪) من أمثلة التدريب، يتفوق القارئ المعزز بالمعرفة (KAR) على نماذج فهم القراءة الآلية الأكثر تقدمًا بمقدار كبير، وهو لا يزال معقول المتانة ضد الضوضاء.