HyperAIHyperAI
منذ 17 أيام

الإجابة على الأسئلة المفتوحة فوق الجداول والنصوص

Wenhu Chen, Ming-Wei Chang, Eva Schlinger, William Wang, William W. Cohen
الإجابة على الأسئلة المفتوحة فوق الجداول والنصوص
الملخص

في الإجابة على الأسئلة المفتوحة (QA)، يتم إنتاج إجابة السؤال من خلال استرجاع وتحليل وثائق قد تحتوي على إجابات للسؤال. وقد ركزت معظم أنظمة الإجابة على الأسئلة المفتوحة حتى الآن على استرجاع المعلومات من نصوص غير منظمة فقط. في هذه الدراسة، نقدم لأول مرة نموذجًا للإجابة على الأسئلة المفتوحة التي تعتمد على كل من البيانات الجدولية والنصية، ونقدم مجموعة بيانات كبيرة جديدة تُسمى "Open Table-and-Text Question Answering" (OTT-QA) لتقييم الأداء في هذا المهمة. وتعتبر معظم الأسئلة في OTT-QA تتطلب استنتاجًا متعدد الخطوات (multi-hop inference) عبر البيانات الجدولية والنصوص غير المنظمة، كما أن الأدلة اللازمة للإجابة على السؤال قد تكون موزعة بطرق مختلفة بين هذين النوعين من المدخلات، مما يجعل استرجاع الأدلة أمرًا صعبًا جدًا — حيث يحقق النموذج الأساسي الذي يستخدم مسترجعًا تكراريًا وقارئًا مبنيًا على BERT درجة مطابقة دقيقة أقل من 10٪. ثم نقترح تقنيتين جديدتين لمعالجة تحدي استرجاع ودمج الأدلة في سياق OTT-QA. الأولى هي استخدام تقنية "الدمج المبكر" (early fusion) لدمج وحدات جدولية ونصية ذات صلة عالية في كتلة مدمجة، مما يوفر سياقًا أوسع للبحث من قبل المسترجع. والثانية هي استخدام قارئ متعدد الكتل (cross-block reader) لتمثيل الترابطات المتقاطعة بين عدة أدلة مسترجعة باستخدام انتباه نادر عالمي-محلي. وعند دمج هاتين التقنيتين، يرتفع الأداء بشكل كبير ليصل إلى أكثر من 27٪.

الإجابة على الأسئلة المفتوحة فوق الجداول والنصوص | أحدث الأوراق البحثية | HyperAI