العقل الجماعي الاصطناعي: التجانس غير المحدود للنماذج اللغوية (وغيرها)
Liwei Jiang Yuanjun Chai Margaret Li Mickel Liu Raymond Fok Nouha Dziri Yulia Tsvetkov Maarten Sap Yejin Choi

الملخص
تواجه النماذج اللغوية الكبيرة (LMs) صعوبات متكررة في إنتاج محتوى إبداعي متنوع وطبيعي يشبه المحتوى البشري، ما يثير مخاوف من تجانس تدريجي في التفكير البشري على المدى الطويل نتيجة التعرض المتكرر لمخرجات متشابهة. ومع ذلك، تظل الطرق القابلة للتوسع لتقييم تنوع مخرجات النماذج محدودة، خصوصًا خارج المهام الضيقة مثل توليد الأرقام العشوائية أو الأسماء، أو خارج التوليد المتكرر من نموذج واحد. لسد هذه الفجوة، نقدّم "إنفنيتي-تشات" (Infinity-Chat)، وهو مجموعة بيانات ضخمة تضم 26 ألف سؤال مفتوح وواقعي ومتنوع من المستخدمين، تسمح بوجود طيف واسع من الإجابات المعقولة دون وجود حقيقة صحيحة واحدة. كما نقدّم أول تصنيف شامل لتصنيف الطيف الكامل للأسئلة المفتوحة المقدمة للنماذج اللغوية، يشمل 6 فئات عليا (مثل إنشاء محتوى إبداعي، توليد الأفكار وتحفيز الابتكار) التي تُنقسم بدورها إلى 17 فئة فرعية. باستخدام مجموعة بيانات "إنفنيتي-تشات"، نُقدّم دراسة واسعة النطاق حول ظاهرة "انهيار النمط" (mode collapse) في النماذج اللغوية، ونُظهر تأثير "الدماغ العشبي الاصطناعي" (Artificial Hivemind) بشكل واضح في عمليات التوليد المفتوح، والذي يتميز بـ (1) التكرار الداخلي بين النماذج، حيث يُنتج نموذج واحد إجابات متشابهة باستمرار، وبشكل أكثر وضوحًا بـ (2) التجانس بين النماذج، حيث تُنتج نماذج مختلفة إجابات متشابهة بشكل ملحوظ. كما تتضمن مجموعة بيانات "إنفنيتي-تشات" 31,250 تقييمًا بشريًا، تشمل تقييمات مطلقة ومقارنة بين الخيارات، مع وجود 25 تقييمًا بشريًا مستقلًا لكل مثال. وهذا يمكّن من دراسة التفضيلات البشرية الجماعية والمتخصصة فرديًا استجابةً للأسئلة المفتوحة. تُظهر نتائجنا أن النماذج اللغوية الحديثة، ونماذج المكافآت، ومُقيّمي النماذج لا تتماشى جيدًا مع التقييمات البشرية عند التعامل مع إجابات تُثير تفضيلات مميزة ومختلفة بين المقيّمين، رغم الحفاظ على جودة إجمالية مماثلة. بشكل عام، تمثل "إنفنيتي-تشات" المورد الأول على نطاق واسع لدراسة منهجية للأسئلة المفتوحة الواقعية الموجهة للنماذج اللغوية، وتكشف عن رؤى حاسمة توجه الأبحاث المستقبلية لتقليل المخاطر الأمنية طويلة الأمد التي تطرحها ظاهرة "الدماغ العشبي الاصطناعي".
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.