HyperAI

عندما يُستخدم مصطلح "محتمل" أو "غالبًا" من قبل الإنسان، يحمل معنى متفق عليه نسبيًا، حتى وإن كان غامضًا. لكن عندما يستخدمه نموذج ذكاء اصطناعي مثل ChatGPT، لا يُقيّم الاحتمالات بنفس الطريقة التي نفعلها نحن، كما أظهرت دراسة حديثة نُشرت في مجلة npj Complexity. ورغم أن النماذج الكبيرة للغة تتفوّق في التفاعل اللغوي، فإنها غالبًا ما تختلف عن البشر في توصيف عدم اليقين. ركّزت الدراسة على كلمات تعبّر عن التقدير الاحتمالي، مثل "ربما"، "بشكل محتمل"، و"شديد الاحتمال". وعند مقارنة كيفية تفسير البشر والذكاء الاصطناعي لهذه الكلمات من حيث النسب المئوية، وُجد فجوة واضحة. فبينما يتفق النموذج والبشر في التصنيف المطلق مثل "مستحيل"، فإن التباين يزداد في الكلمات الوسطية. فمثلاً، قد يُشير مصطلح "محتمل" في نموذج ذكاء اصطناعي إلى احتمال 80%، بينما يُفهمه الإنسان على أنه نحو 65%. هذا التباين قد يعود إلى أن البشر يستخدمون السياق وتجاربهم الشخصية لفهم مثل هذه العبارات، بينما يعتمد الذكاء الاصطناعي على متوسط التعبيرات المختلفة عن نفس الكلمة في البيانات التي تم تدريبه عليها، ما يؤدي إلى تحيّزات أو تفسيرات غير دقيقة. كما أظهرت الدراسة أن النماذج الحساسة لعوامل مثل الجنس واللغة. فعندما تُستخدم صيغة "هو" بدلًا من "هي" في السؤال، تصبح تقديرات الاحتمال أكثر صرامة، مما يعكس تحيّزات موجودة في البيانات التدريبية. كما أن تغيير اللغة من الإنجليزية إلى الصينية أدى إلى تغير في تقديرات الاحتمال، ربما بسبب اختلاف أساليب التعبير عن عدم اليقين بين اللغتين. هذا التباين ليس مجرد تفصيل لغوي، بل يشكل تحدّيًا جوهريًا لأمان الذكاء الاصطناعي وتفاعل البشر معه. مع انتشار استخدام هذه النماذج في مجالات حساسة مثل الطب، السياسة العامة، والتقارير العلمية، يصبح فهم كيفية توصيل الذكاء الاصطناعي للمخاطر أمرًا حاسمًا لبناء الثقة. فلو وصف نموذج ذكاء اصطناعي تأثيرًا جانبيًا بأنه "نادر الحدوث"، بينما يقصد به احتمالًا أعلى بكثير مما يفهمه الطبيب، فقد يؤدي ذلك إلى قرارات خاطئة. تُعنى أبحاث متعددة بفهم كيفية تقييم البشر للغموض منذ الستينيات، وكان ذلك مبكرًا في محاولة تحسين تقارير الاستخبارات. ومؤخرًا، تزايدت الجهود لفهم سلوك النماذج العصبية العميقة. لكن هذه الدراسة تضيف بعدًا جديدًا، إذ تنظر إلى التفاعل بين الإنسان والذكاء الاصطناعي كنظام بيولوجي يُمكن أن يُفقد فيه المعنى. وبدلًا من قياس الذكاء فقط، تطرح سؤالًا أعمق: هل هو متوافق مع البشر؟ بعض الباحثين يجربون تقنيات مثل "الاستدلال التسلسلي"، التي تطلب من الذكاء الاصطناعي توضيح خطواته، لكن الدراسة وجدت أن هذا لا يكفي دائمًا لسد الفجوة بين البيانات الإحصائية والكلمات الوصفية. المستقبل يتطلب نماذج قادرة على فهم "وزن" عدم اليقين الذي تُعبّر عنه، وليس فقط التنبؤ بالكلمة التالية. ويدعو الباحثون إلى تطوير مقاييس أكثر دقة لضمان اتساق النموذج، بحيث يُستخدم نفس المصطلح عند نفس الاحتمال دائمًا. فضمان أن "بشكل محتمل" تعني بالفعل "بشكل محتمل" هو خطوة حاسمة لجعل الذكاء الاصطناعي شريكًا موثوقًا، وليس مجرد محاكاة ذكية للغة.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

"ربما" لا تعني نفس الشيء للذكاء الاصطناعي كما تعنيه لك

الروابط ذات الصلة

Command Palette

"ربما" لا تعني نفس الشيء للذكاء الاصطناعي كما تعنيه لك

الروابط ذات الصلة

Command Palette

"ربما" لا تعني نفس الشيء للذكاء الاصطناعي كما تعنيه لك

الروابط ذات الصلة