العقل الجماعي الاصطناعي: التجانس غير المحدود للنماذج اللغوية (وأبعد من ذلك)
العقل الجماعي الاصطناعي: التجانس غير المحدود للنماذج اللغوية (وأبعد من ذلك)
Liwei Jiang Yuanjun Chai Margaret Li Mickel Liu Raymond Fok Nouha Dziri Yulia Tsvetkov Maarten Sap Alon Albalak Yejin Choi

الملخص
غالبًا ما تواجه نماذج اللغة (LMs) صعوبة في إنتاج محتوى خلاق متنوع وطبيعي يشبه المحتوى البشري، مما يثير مخاوف من تجانس الفكر البشري على المدى الطويل نتيجة التعرض المتكرر لنماذج إخراج متشابهة. ومع ذلك، تظل الطرق القابلة للتوسع لتقييم تنوع إخراج نماذج اللغة محدودة، خصوصًا خارج المهام الضيقة مثل توليد الأرقام العشوائية أو الأسماء، أو خارج العينات المتكررة من نموذج واحد فقط. نقدم "إنفينيتي-تشات" (Infinity-Chat)، وهي مجموعة بيانات كبيرة بحجم 26 ألف سؤال واقعي ومتعدد الأوجه من المستخدمين، مفتوحة الاتجاه، وتسمح بمجموعة واسعة من الإجابات المعقولة دون وجود إجابة صحيحة واحدة مطلقة. كما نقدّم أول تصنيف شامل لتصنيف طيف كامل من الأسئلة المفتوحة الموجهة إلى نماذج اللغة، يشمل 6 فئات رئيسية (مثل التفكير الإبداعي وطرح الأفكار)، والتي تُفصّل بدورها إلى 17 فئة فرعية. باستخدام مجموعة بيانات "إنفينيتي-تشات"، نُقدّم دراسة واسعة النطاق حول ظاهرة الانهيار النمطي (mode collapse) في نماذج اللغة، ونكشف عن تأثير "العقل الجماعي الاصطناعي" (Artificial Hivemind) المُلحوظ في التوليد المفتوح الاتجاه، والذي يتميز بـ(1) التكرار الداخلي للنموذج، حيث يُولّد نموذج واحد إجابات متشابهة باستمرار، وبشكل أوضح (2) التجانس بين النماذج، حيث تُنتج نماذج مختلفة إجابات متشابهة بشكل ملحوظ. كما تتضمن "إنفينيتي-تشات" 31,250 تقييمًا بشريًا، تشمل تقييمات مطلقة وتقديرات تفضيلية ثنائية، مع 25 تقييمًا بشريًا مستقلًا لكل مثال. هذا يمكّن من دراسة التفضيلات الجماعية والفردية الخاصة بالبشر استجابةً للأسئلة المفتوحة. تُظهر نتائجنا أن نماذج اللغة، ونماذج المكافآت، ومحكمي النماذج (LM judges) أقل تكيّفًا مع التقييمات البشرية في حالات إنتاج نماذج تُثير تفضيلات مميزة ومختلفة بين المقيّمين، رغم الحفاظ على جودة إجمالية مماثلة. في المجمل، تمثل "إنفينيتي-تشات" أول مورد واسع النطاق لدراسة منهجية للأسئلة المفتوحة الواقعية الموجهة إلى نماذج اللغة، وتكشف عن رؤى حاسمة تُوجّه الأبحاث المستقبلية في تقليل المخاطر الأمنية طويلة الأجل التي تطرحها ظاهرة "العقل الجماعي الاصطناعي".
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.