HyperAIHyperAI
منذ 16 أيام

تجميع الأخبار الأوردية باستخدام العناوين الرئيسية

{Kamran Malik, Faisal Bukhari, Waheed Iqbal, Samia Khaliq}
الملخص

يقدم هذا البحث خوارزمية جديدة تُعدّ وتنقّب عنها آلية لتصنيف الأخبار الأوردية تلقائيًا من وكالات إخبارية مختلفة. وتشكل هذه المهمة تحديًا كبيرًا نظرًا لعدم توفر أي مكتبات معالجة لغوية للغة الأوردية. يتكوّن مجموعة البيانات التجريبية للباحثين من أخبار صادرة عن وسائل إعلام باكستانية معروفة، تشمل "جانج"، و"بي بي سي الأوردية"، و"إكسبريس"، و"أوردو بوينت"، و"صوت أمريكا الأوردية" (VOA). تعتمد الخوارزمية المقترحة فقط على عناوين الأخبار لتصنيفها. ويدّعي الباحثون أن عناوين الأخبار توفر ملخصًا موجزًا للمحتوى الإخباري، وهو ما يبرر استخدامها بدلًا من استخدام النص الكامل للخبر. وتشير النتائج التجريبية إلى متوسطات دقيقة (precision) على المستوى الصغير (micro) والمستوى الكبير (macro) بقيمتين 0.45 و0.48 على التوالي، عند تحديد الأخبار المشابهة باستخدام العناوين فقط.

تجميع الأخبار الأوردية باستخدام العناوين الرئيسية | أحدث الأوراق البحثية | HyperAI