HyperAI

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات

منذ 7 أعوام
معلومة
Sparanoid
特色图像

لا يحتاج الشباب الذين يتمتعون بمستوى معين من الثقافة العلمية حتى إلى النقر على هذه العناوين الرئيسية لمعرفة أنها شائعات أو مبالغ فيها، ولكن هذه المقالات تنتشر على نطاق واسع في مجموعات WeChat ودوائر الأصدقاء لجيل آبائنا كل يوم.

من الصعب تحديد مصدر الأخبار ومصداقيتها في العالم الافتراضي، خاصة بالنسبة للآباء. طالما أن المقال يذكر معرفة علمية معقدة أو مؤسسات علمية غامضة، أو حتى يضيف بعض التحريض الوطني أو العاطفي، فمن المرجح أن يرتبك الناس بسبب الشائعات وحتى يصبحوا جزءًا من انتشارها.

تحاول العديد من المنصات بكل الطرق إنشاء آلية لدحض الشائعات. في الماضي، كانت هذه الآلية تتكون بشكل أساسي من الشكاوى + المراجعة اليدوية، ولكن في شكل المراجعة اليدوية، فهي لا تزال تشكل قطرة في دلو.

نفس الشيءالعالم نفس الإشاعة

وتحدث هذه المشكلة أيضًا في الولايات المتحدة. إن كلمة "الشائعة" المستخدمة عادة في الصين يتم ترجمتها عادة إلى اللغة الإنجليزية بـ "شائعة". في الواقع، هذه الكلمة تعني الإشاعات أو السماع. وقد تترجمها مؤسسات إخبارية أكثر دقة بـ "الشائعات الكاذبة"، وهو ما يعني الإشاعات الكاذبة.

ومن المثير للاهتمام أنه عندما أردنا مقارنة أنواع الشائعات الأكثر احتمالاً للانتشار على نطاق واسع، وجدنا أن صناع الشائعات في جميع أنحاء العالم اختاروا الأخبار المتعلقة بوفاة المشاهير.

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات
السيد جين يونغ يموت كل عام تقريبًا

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات
ولا تعد مثل هذه الشائعات أمرا غير شائع في الولايات المتحدة.

استخدام الذكاء الاصطناعي لتنقية الأخبار

في الولايات المتحدة، استخدم مهندس يُدعى آرون إيديل الذكاء الاصطناعي لإنشاء "جهاز كشف الأخبار المزيفة FakeBox". على الرغم من أن معدل دقتها مرتفع نسبيًا، إلا أن المحتوى غير مناسب للنظام الصيني في السياق الإنجليزي. وثانياً، إذا كان من المقرر أن يتم استخدامه تجارياً، فما زال هناك مجال كبير للتحسين. ومع ذلك، فإن عملية بحثه ستكون بالتأكيد ذات قيمة مرجعية كبيرة للمحترفين المشاركين في أبحاث مماثلة.

لم تكن عملية تصميم "جهاز كشف الأخبار المزيفة Fake News Detector" كلها سلسة. وكان أهم نقطة تحول في نجاحه هو أنه غير هدفه من الحكم على الأخبار المزيفة إلى الحكم على الأخبار الحقيقية - فالحقيقة ثابتة دائمًا، بينما الأوهام متنوعة.

فيما يلي رحلته العقلية عند تصميم FakeBox:

السؤال 1: كيف نعرف الأخبار الكاذبة؟

كانت الصعوبة الأولى التي واجهتها غير متوقعة إلى حد ما.بعد دراسة بعض الأخبار المزيفة، وجدت أن الأخبار المزيفة ليست كلها كاذبة، فبعض الأخبار مبالغ فيها، وبعض الأخبار غير مؤكدة. في الواقع، يجب تقسيم الأخبار الكاذبة إلى أنواع مختلفة: أخطاء واضحة، نصفها صحيح ونصفها كاذب، وعلم زائف كامل، وتعليقات على الأخبار الكاذبة، وما إلى ذلك.

لذلك، يجب أن يتم فحص الأخبار المزيفة بشكل شامل والقضاء عليها واحدة تلو الأخرى.

التجربة الأولى: حل المشكلة باستخدام نموذج تحليل المشاعر

في البداية، قمت بإنشاء أداة صغيرة بنفسي، باستخدام برنامج زاحف لجمع عناوين المقالات والأوصاف والمؤلفين والمحتوى، ثم أرسلت النتائج إلى نموذج تحليل المشاعر. لقد استخدمت مربع نص، وهو مناسب جدًا لأنه يمكنه إرسال النتائج بسرعة. بالنسبة لكل مقال، سوف يعطي Textbox درجة. تعتبر النتيجة الأعلى من 5 بمثابة رد فعل إيجابي، وتعتبر النتيجة الأقل من 5 بمثابة رد فعل سلبي. لقد قمت أيضًا بإنشاء خوارزمية صغيرة لحساب درجات العنوان والمحتوى والمؤلف وما إلى ذلك للنص بشكل منفصل، وإضافتها معًا للتأكد من أن الدرجة شاملة ومتكاملة.

لقد عمل بشكل جيد في البداية، لكنه توقف عن العمل بعد اختبار المقالة السابعة أو الثامنة. ومع ذلك، فإن هذا النموذج التصميمي قريب جدًا من نظام اكتشاف الشائعات الذي تخيلته.

ولكن النتيجة كانت الفشل.

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات

التجربة الثانية: حل المشكلات باستخدام نماذج معالجة اللغة الطبيعية

لقد نصحني صديقي ديفيد هيرنانديز بتدريب النموذج على النص نفسه. لقد حاولت فهم خصائص الأخبار المزيفة، مثل مصادر المواقع الإلكترونية وأسماء المؤلفين، لمعرفة ما إذا كان بإمكاني إنشاء مجموعة بيانات بسرعة لتدريب نموذج.

لقد قضينا بضعة أيام في جمع عدد كبير من مجموعات البيانات المختلفة التي بدت مفيدة لنماذج التدريب. كنا نظن أن مجموعة البيانات كبيرة بما يكفي، ولكن في الواقع لم يتم تصنيف محتوى مجموعة البيانات بشكل صحيح منذ البداية، لأن بعض المواقع الإلكترونية التي تم تصنيفها على أنها "مزيفة" أو "مضللة" تحتوي في بعض الأحيان على مقالات حقيقية، أو تقوم فقط بإعادة توجيه محتوى مواقع إلكترونية أخرى، وبالتالي فإن النتائج ليست مثالية.

بدأت بقراءة كل مقال بنفسي وقضيت وقتًا طويلًا في معالجة البيانات. ورغم أن هذه العملية كانت صعبة للغاية، إلا أنني عندما رأيت هذه الأخبار الكاذبة والخبيثة وحتى العنيفة هذه الأيام، بدأت أشك في الحضارة التي يدعمها الإنترنت. ولكنني كنت آمل أيضًا أن يتمكن المزيد من الأشخاص من استخدام أدوات أفضل لتجنب التعرض للتسمم بالشائعات. حققت مجموعة البيانات بعد أن أضفت المراجعة اليدوية دقة تبلغ حوالي 70% في الاختبار.

لكن هذه الطريقة لها عيب خطير. بعد أن حاولنا التحقق من مقالات خارج مجموعة البيانات، لم نتمكن بعد من تحديد صحة المعلومات بشكل صحيح.

لذلك فإنه لا يزال فشلا.

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات

التجربة الثالثة: لا تبحث عن الأخبار الكاذبة كمجموعة بيانات، بل ابحث عن الأخبار الحقيقية

لقد كانت نقطة التحول في نجاح هذه المسألة هي اقتراح من ديفيد أيقظني: لقد اقترح أن مفتاح تحسين الدقة قد يكون تبسيط المشكلة. ربما ما نحتاج إلى فعله هو عدم اكتشاف الأخبار المزيفة، بل اكتشاف الأخبار الحقيقية. لأن الأخبار الحقيقية أسهل في التصنيف - فالمقالات كلها حقائق ونقاط بارزة، مع القليل من التوضيح الإضافي، وهناك الكثير من الموارد لتأكيد صحة الأخبار. فبدأت بجمع البيانات مرة أخرى.

أنا فقط أقسم الأخبار إلى فئتين: حقيقية وغير حقيقية. تشمل المقالات غير الحقيقية السخرية، ومقالات الرأي، والأخبار الكاذبة، وغيرها من المقالات التي لم تُكتب بطريقة واقعية بحتة.

لقد نجحنا هذه المرة بدقة تزيد عن 95%.

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات

النموذج، المسمى Fakebox، يعين درجة لكل مقال، والدرجة المنخفضة جدًا قد تعني أن المقال مزيف، أو مقال رأي، أو هجاء، أو أي شيء آخر. ويحتوي Fakebox أيضًا على مجموعة من واجهات برمجة التطبيقات REST، ويمكنك دمجها في أي بيئة، أو نشرها على Docker.

لكن لا يزال هناك عيب: إذا كانت المقالة قصيرة للغاية، أو تحتوي بشكل أساسي على آراء أو اقتباسات لأشخاص آخرين، فقد يكون من الصعب الحكم على ما إذا كانت صحيحة أم خاطئة.

لذا، فإن Fakebox ليس الحل النهائي، ولكن آرون إيديل آمل أن يكون هذا النموذج مفيدًا للمقالات التي تحتاج إلى تحديد ما إذا كانت صحيحة أو خاطئة.

خلق الانسجام الأسري واستخدام الذكاء الاصطناعي لمساعدة الآباء على تبديد الشائعات