HyperAI

هلوسة

في مجال الذكاء الاصطناعي، الهلوسة أو الهلوسة الاصطناعية (وتسمى أيضًا التخيل أو الوهم) هي استجابة يتم إنشاؤها بواسطة الذكاء الاصطناعي تحتوي على معلومات خاطئة أو مضللة يتم تقديمها على أنها حقيقة. وبشكل عام، يشير ذلك إلى الظاهرة التي يكون فيها المحتوى الذي يولده النموذج غير متوافق مع الحقائق الواقعية أو مدخلات المستخدم. إن كيفية فحص المعرفة المتخصصة بشكل فعال واستخدام الخبرة عالية الدقة في التعلم التعزيزي لتحقيق التكرار وتحديث النماذج الكبيرة هي طريقة مهمة للقضاء على الأوهام العلمية.إن الوهم وظهور النماذج الكبيرة هما نفس المبدأ.

الهلوسة في معالجة اللغة الطبيعية

في معالجة اللغة الطبيعية، يتم تعريف الهلوسة في كثير من الأحيان على أنها "محتوى تم إنشاؤه ليس له معنى أو لا يتوافق مع محتوى المصدر المقدم". هناك طرق مختلفة لتصنيف الهلوسة: داخلية وخارجية، اعتمادًا على ما إذا كانت المخرجات تتعارض مع المصدر أو لا يمكن التحقق منها من المصدر؛ والمجال المغلق والمجال المفتوح، اعتمادًا على ما إذا كان الإخراج يتعارض مع المطالبة، على التوالي.

أسباب الهلوسة في معالجة اللغة الطبيعية

هناك عدة أسباب تجعل نماذج اللغة الطبيعية قادرة على خداع البيانات.

  • وهم البيانات

السبب الرئيسي وراء هلوسة البيانات هو اختلاف مرجع المصدر. يحدث هذا الخلاف إما (1) كنتيجة لجمع البيانات الاستدلالية أو (2) لأن طبيعة بعض مهام توليد اللغة الطبيعية تنطوي حتما على مثل هذا الخلاف. عندما يتم تدريب نموذج على بيانات تحتوي على تناقضات بين المصدر والمرجع (الهدف)، يمكن تشجيع النموذج على إنشاء نص ليس بالضرورة قائمًا على أسس جيدة ومخلصًا للمصدر المقدم.

  • الأوهام التي خلقتها النماذج

لقد ثبت أن الهلوسة هي نتيجة ثانوية لا يمكن تجنبها إحصائيًا لأي نموذج توليدي غير كامل يتم تدريبه لزيادة احتمالية حدوث الهلوسة أثناء التدريب، مثل GPT-3، وأن التعلم النشط (مثل التعلم التعزيزي من ردود الفعل البشرية) مطلوب لتجنبها. وتتبنى دراسات أخرى منظورًا مجسمًا، حيث تزعم أن الهلوسة ناجمة عن التوتر بين الحداثة والفائدة. على سبيل المثال، عرّفت تيريزا أمابيل وبرات الإبداع البشري بأنه توليد أفكار جديدة ومفيدة.

يمكن أن تؤدي الأخطاء في التشفير وفك التشفير بين النص والتمثيل إلى حدوث الهلوسة. عندما يتعلم المبرمج ارتباطات خاطئة بين أجزاء مختلفة من بيانات التدريب، فقد يتسبب ذلك في اختلاف معلومات الخطأ الناتجة عن الإدخال. يقوم جهاز فك التشفير بأخذ المدخلات المشفرة من جهاز التشفير ويولد التسلسل المستهدف النهائي. هناك جانبان من فك التشفير يمكن أن يؤديا إلى الهلوسة. أولاً، قد يقوم جهاز فك التشفير بمعالجة الجزء الخاطئ من مصدر الإدخال المشفر، مما يؤدي إلى حدوث أخطاء. ثانياً، إن تصميم استراتيجية فك التشفير في حد ذاته قد يؤدي إلى الأوهام. ترتبط استراتيجيات فك التشفير التي تزيد من تنوع الأجيال (على سبيل المثال، أخذ العينات من أعلى إلى أسفل) بشكل إيجابي بزيادة في الهلوسة.

مراجع

【1】https://en.wikipedia.org/wiki/Hallucination_(artificial_intelligence)