HyperAIHyperAI
منذ شهر واحد

"كذاب، كذاب، بنطلونك يحترق": مجموعة بيانات جديدة كمعيار مرجعي للكشف عن الأخبار المزيفة

William Yang Wang
"كذاب، كذاب، بنطلونك يحترق": مجموعة بيانات جديدة كمعيار مرجعي للكشف عن الأخبار المزيفة
الملخص

اكتشاف الأخبار المزيفة تلقائيًا هو مشكلة صعبة في مجال اكتشاف الخداع، ولديه تأثيرات سياسية واجتماعية حقيقية هائلة. ومع ذلك، فإن الطرق الإحصائية لمكافحة الأخبار المزيفة قد تم تحديدها بشكل كبير بسبب نقص مجموعات البيانات المرجعية المصنفة. في هذا البحث، نقدم liar: مجموعة بيانات جديدة متاحة للجمهور للاستخدام في اكتشاف الأخبار المزيفة. قمنا بجمع بيانات تتضمن 12,800 تصريح قصير مصنف يدويًا على مدى عقد من الزمن وفي سياقات مختلفة من موقع PolitiFact.com، الذي يقدم تقرير تحليل مفصل وروابط إلى الوثائق الأصلية لكل حالة. يمكن استخدام هذه المجموعة من البيانات أيضًا لأبحاث التحقق من الحقائق. ومن الجدير بالذكر أن هذه المجموعة الجديدة من البيانات أكبر بمقدار عقد مما كانت عليه أكبر المجموعات العامة السابقة من نوع مشابه. بشكل تجريبي، ندرس اكتشاف الأخبار المزيفة تلقائيًا بناءً على الأنماط اللغوية السطحية. لقد صممنا شبكة عصبية هجينة جديدة تعتمد على التعلم العميق لدمج البيانات الثانوية مع النصوص. نوضح أن هذا النهج الهجين يمكن أن يحسن نموذج التعلم العميق القائم على النصوص فقط.

"كذاب، كذاب، بنطلونك يحترق": مجموعة بيانات جديدة كمعيار مرجعي للكشف عن الأخبار المزيفة | أحدث الأوراق البحثية | HyperAI