HyperAIHyperAI

Command Palette

Search for a command to run...

أصداء الإسكندرية: مورد كبير للتلخيص متعدد اللغات للكتب

Alessandro Scirè Simone Conia Simone Ciciliano Roberto Navigli

الملخص

في السنوات الأخيرة، ركزت الأبحاث في مجال تلخيص النصوص بشكل رئيسي على مجال الأخبار، حيث تكون النصوص عادةً قصيرة وتمتلك خصائص تخطيطية قوية. أما مهمة تلخيص الكتب الكاملة، فتفرض تحديات إضافية يصعب التصدي لها باستخدام الموارد الحالية، نظرًا لصغر حجمها وانعدام توفرها إلا باللغة الإنجليزية. لتجاوز هذه القيود، نقدم "أصداء الإسكندرية" أو باختصار "أصداء"، وهي موارد كبيرة لتلخيص الكتب متعددة اللغات. تتميز "أصداء" بثلاثة مجموعات بيانات جديدة: (أ) أصداء-ويكي، لتلخيص الكتب متعدد اللغات؛ (ب) أصداء-إكسوم، لتلخيص كتب متعدد اللغات بشكل شديد التكثيف؛ (ج) أصداء-فيري سوم، لتلخيص الكتب باستخلاص المحتوى. إلى حد معرفتنا، تمثل "أصداء"، بفضل آلاف الكتب والملخصات التي تحتويها، أكبر مورد متاح، والأول من نوعه متعدد اللغات، حيث يغطي 5 لغات و25 زوجًا من اللغات. بالإضافة إلى موارد "أصداء"، نقدم أيضًا نموذجًا أساسيًا جديدًا يعتمد على الاستخلاص أولاً ثم التلخيص الاستخلاصي (extractive-then-abstractive)، وبناءً على نتائج تجاربنا التحليلية والتحليل اليدوي للملخصات المُنتجة، نجادل بأن هذا النموذج أكثر ملاءمة لتلخيص الكتب مقارنةً بالنهج الاستخلاصية البسيطة. ونُطلق مواردنا وبرمجياتنا عبر الرابط التالي: https://github.com/Babelscape/echoes-from-alexandria، في أمل أن يُشجع هذا الإطلاق أبحاثًا مبتكرة في مجال تلخيص الكتب متعدد اللغات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp