HyperAIHyperAI

Command Palette

Search for a command to run...

HiStruct+: تحسين تلخيص النص الاستخراجي باستخدام معلومات البنية الهرمية

Qian Ruan Malte Ostendorff Georg Rehm

الملخص

عادةً ما تتعامل نماذج اللغة المستندة إلى الشبكات العصبية من نوع Transformer مع النصوص كسلسلات خطية. ومع ذلك، فإن معظم النصوص لديها أيضًا بنية هرمية متأصلة، بمعنى أن أجزاء من النص يمكن تحديدها باستخدام موقعها في هذه الهرمية. بالإضافة إلى ذلك، عناوين الأقسام عادةً ما تشير إلى الموضوع المشترك لجملها الخاصة. نقترح نهجًا جديدًا لصياغة واستخراج وترميز وحقن المعلومات البنيوية الهرمية بشكل صريح في نموذج تلخيص استخراجي يعتمد على نموذج لغة Transformer مُدرب مسبقًا ومُحصور بالترميز (نموذج HiStruct+)، مما يحسن بشكل كبير مقاييس ROUGE لأفضل التقنيات الحالية (SOTA) في التلخيص الاستخراجي على قاعدة بيانات PubMed و arXiv. باستخدام إعدادات تجريبية مختلفة على ثلاثة مجموعات بيانات (أي، CNN/DailyMail، PubMed و arXiv)، يتفوق نموذج HiStruct+ الخاص بنا بشكل جماعي على خط أساس قوي، حيث يختلف هذا الخط الأساس عن نموذجنا فقط في عدم حقنه للمعلومات البنيوية الهرمية. كما تم ملاحظة أن كلما كانت البنية الهرمية للبيانات أكثر وضوحًا، كانت التحسينات التي حققتها طريقة عملنا أكبر. أثبتت دراسة الإزالة أن المعلومات الموضعية الهرمية هي المساهم الرئيسي في أداء النموذج الذي يعد أفضل التقنيات الحالية (SOTA).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp