HyperAI

التلخيص التلقائي

التلخيص التلقائي هو عملية اختصار المستندات النصية باستخدام البرامج من أجل إنشاء ملخص يحتوي على النقاط الرئيسية للمستند الأصلي. وهو حاليًا جزء من مجال التعلم الآلي واستخراج البيانات، وهدفه هو العثور على مجموعات فرعية من البيانات التي تحتوي على "معلومات" ذات صلة.

هناك حاليًا طريقتان للتلخيص التلقائي: الاستخراج والتجريد. الاستخراج هو تكوين ملخص بناءً على مجموعة فرعية من الكلمات أو العبارات أو الجمل في النص الأصلي؛ التجريد هو إنشاء تمثيل دلالي داخلي ثم استخدام تقنية توليد اللغة الطبيعية لإنشاء ملخص قريب من التعبير البشري.

هناك نوعان رئيسيان من مهام التلخيص الاستخراجي اعتمادًا على ما يركز عليه الملخص، الأول هو التلخيص العام، والذي يركز على الحصول على ملخص عام لمجموعة أو ملخص لمقال وما إلى ذلك. والثاني هو التلخيص المعتمد على الاستعلام، والذي يلخص الكائنات الخاصة بالاستعلام.

الطريقة الشائعة لتقييم التلخيص التلقائي هي مقارنته بالتلخيص البشري، والذي يمكن تقسيمه بشكل رئيسي إلى تقييم داخلي وتقييم خارجي، وبين النص وداخل النص.

التقييمات الداخلية والخارجية

يتم استخدام التقييم الداخلي لاختبار نظام التلخيص نفسه، وخاصة تقييم تماسك الملخص ومدى إعلامه؛ يعتمد التقييم الخارجي على تأثير الملخص على إنجاز المهام الأخرى، بما في ذلك تأثير الملخص على تقييم الصلة وفهم القراءة والمهام الأخرى.

بين النصوص وداخل النصوص

تقوم الطرق داخل النص بتقييم مخرجات نظام تلخيص محدد؛ تركز أساليب التداخل النصي على التحليل المقارن لمخرجات العديد من أنظمة التلخيص.