HyperAIHyperAI

Command Palette

Search for a command to run...

التدريب المسبق يلتقي بالتجزئة: نموذج هجين لاستخلاص ملخصات متعددة الوثائق

Seba Susan Akanksha Karotia

الملخص

في هذا العصر الذي امتلأ فيه الإنترنت بمعلومات ضخمة، أصبح استخلاص وتصنيف المعلومات ذات الصلة يدويًا أمرًا صعبًا للغاية ومستهلكًا للوقت. ولهذا السبب، أصبح من الضروري توافر أداة تلخيص تلقائية للوثائق، لتستخرج المعلومات المهمة من مجموعة من الوثائق التي تتناول موضوعات متشابهة أو مرتبطة. يتيح تلخيص النصوص متعددة الوثائق استخلاص المحتوى المهم والمرتبط من عدة وثائق مع تقليل التكرار قدر الإمكان. وقد تم في هذه الدراسة تطوير نظام لتلخيص النصوص متعددة الوثائق باستخدام نهج استخلاص غير مُدرَّب (unsupervised extractive-based). ويُعد النموذج المقترح تكاملًا لنموذجين لتعلم آلي: نموذج T5 المُدرَّب مسبقًا باستخدام معمارية المحولات (Transformer)، وخوارزمية تجميع K-Means. وتم إجراء التجارب على مجموعة بيانات أخبار معيارية تُعرف بـ "مؤتمر فهم الوثائق" (Document Understanding Conference - DUC2004). واستُخدمت مقاييس تقييم ROUGE لتقييم أداء النموذج المقترح على مجموعة DUC2004. وأظهرت النتائج تفوقًا ملحوظًا في الأداء مقارنةً بالطرق غير المُدرَّبة المتطورة حاليًا في المجال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp