HyperAI

أظهرت دراسة جديدة أجرتها فريق بحثي من Salesforce AI Research بقيادة بريناف نارايانان فينك، أن أدوات الذكاء الاصطناعي المستخدمة في البحث، مثل Perplexity وYou.com وBing Chat، غالبًا ما تكون غير موثوقة، وتُظهر تحيزًا مفرطًا، وتعتمد على مصادر غير دقيقة. ووجدت الدراسة أن ما يقارب الثلث من العبارات التي تقدمها هذه الأدوات لا تُدعم بمرجع موثوق، بينما ارتفع هذا المعدل إلى 47% في حالة نموذج GPT-4.5 من OpenAI. لتحليل هذه المشكلات، طوّر الباحثون إطارًا تقييميًا يُسمى DeepTRACE، يقيّم أدوات الذكاء الاصطناعي عبر ثمانية معايير رئيسية، منها دقة الاقتباس، والانحياز، والثقة الزائدة، وموازنة الآراء. تم اختبار الأنظمة على أكثر من 300 سؤال، توزّعت بين نوعين رئيسيين: أسئلة مناقشة تتناول موضوعات مثيرة للجدل مثل "لماذا لا يمكن للطاقة البديلة أن تحل محل الوقود الأحفوري؟"، وأسئلة متخصصة تختبر المعرفة في مجالات دقيقة مثل "ما هي النماذج الأكثر أهمية في علم الهيدرولوجيا الحاسوبية؟". أظهرت النتائج أن الذكاء الاصطناعي غالبًا ما يقدّم آراء متحيزة، ويعبر عنها بثقة مفرطة، حتى في الحالات التي تتطلب توازنًا في الرأي. هذا السلوك قد يُحدث تأثيرًا "غرف صدى"، حيث يُعرض المستخدم فقط لآراء تتماشى مع مواقفه، متجاهلاً وجهات نظر أخرى. كما كشفت الدراسة أن نسبة دقة المراجع المذكورة في الإجابات تتراوح بين 40% و80%، أي أن جزءًا كبيرًا من المصادر المُقدّمة إما غير صحيحة أو لا تدعم ما ورد في النص. تم التحقق من نتائج DeepTRACE بواسطة مراجعين بشريين لضمان دقة التقييم، مما يعزز مصداقية النتائج. وخلص الباحثون إلى أن الأنظمة القائمة على البحث التي تعتمد على الذكاء الاصطناعي ما زالت بحاجة إلى تطور كبير لضمان سلامتها وفعاليتها، خصوصًا في تقليل مخاطر تكوين غرف صدى وفقدان المستخدم ل自主يته في عملية البحث. الدراسة، التي نُشرت على منصة arXiv، تُعد تحذيرًا مهمًا لمستخدمي الذكاء الاصطناعي، خصوصًا أولئك الذين يعتمدون عليه في البحث الأكاديمي أو اتخاذ قرارات مبنية على معلومات. رغم الراحة والسرعة التي يوفرها الذكاء الاصطناعي، فإنه لا يزال غير موثوق تمامًا، ويتطلب تدقيقًا بشريًا قبل الاعتماد عليه. وتمت هذه المقالة بعناية من قبل فريق تحرير علمي، وتدعمها مساهمات القراء لضمان استمرار الصحافة العلمية المستقلة.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

دراسة جديدة تكشف أن أدوات الذكاء الاصطناعي غالبًا ما تكون غير موثوقة ومتفائلة بشكل مفرط وتحيزية في آرائها

الروابط ذات الصلة

Command Palette

دراسة جديدة تكشف أن أدوات الذكاء الاصطناعي غالبًا ما تكون غير موثوقة ومتفائلة بشكل مفرط وتحيزية في آرائها

الروابط ذات الصلة

Command Palette

دراسة جديدة تكشف أن أدوات الذكاء الاصطناعي غالبًا ما تكون غير موثوقة ومتفائلة بشكل مفرط وتحيزية في آرائها

الروابط ذات الصلة