الملخص

غالبًا ما تواجه نماذج اللغة (LMs) صعوبة في إنتاج محتوى خلاق متنوع وطبيعي يشبه المحتوى البشري، مما يثير مخاوف من تجانس الفكر البشري على المدى الطويل نتيجة التعرض المتكرر لنماذج إخراج متشابهة. ومع ذلك، تظل الطرق القابلة للتوسع لتقييم تنوع إخراج نماذج اللغة محدودة، خصوصًا خارج المهام الضيقة مثل توليد الأرقام العشوائية أو الأسماء، أو خارج العينات المتكررة من نموذج واحد فقط. نقدم "إنفينيتي-تشات" (Infinity-Chat)، وهي مجموعة بيانات كبيرة بحجم 26 ألف سؤال واقعي ومتعدد الأوجه من المستخدمين، مفتوحة الاتجاه، وتسمح بمجموعة واسعة من الإجابات المعقولة دون وجود إجابة صحيحة واحدة مطلقة. كما نقدّم أول تصنيف شامل لتصنيف طيف كامل من الأسئلة المفتوحة الموجهة إلى نماذج اللغة، يشمل 6 فئات رئيسية (مثل التفكير الإبداعي وطرح الأفكار)، والتي تُفصّل بدورها إلى 17 فئة فرعية. باستخدام مجموعة بيانات "إنفينيتي-تشات"، نُقدّم دراسة واسعة النطاق حول ظاهرة الانهيار النمطي (mode collapse) في نماذج اللغة، ونكشف عن تأثير "العقل الجماعي الاصطناعي" (Artificial Hivemind) المُلحوظ في التوليد المفتوح الاتجاه، والذي يتميز بـ(1) التكرار الداخلي للنموذج، حيث يُولّد نموذج واحد إجابات متشابهة باستمرار، وبشكل أوضح (2) التجانس بين النماذج، حيث تُنتج نماذج مختلفة إجابات متشابهة بشكل ملحوظ. كما تتضمن "إنفينيتي-تشات" 31,250 تقييمًا بشريًا، تشمل تقييمات مطلقة وتقديرات تفضيلية ثنائية، مع 25 تقييمًا بشريًا مستقلًا لكل مثال. هذا يمكّن من دراسة التفضيلات الجماعية والفردية الخاصة بالبشر استجابةً للأسئلة المفتوحة. تُظهر نتائجنا أن نماذج اللغة، ونماذج المكافآت، ومحكمي النماذج (LM judges) أقل تكيّفًا مع التقييمات البشرية في حالات إنتاج نماذج تُثير تفضيلات مميزة ومختلفة بين المقيّمين، رغم الحفاظ على جودة إجمالية مماثلة. في المجمل، تمثل "إنفينيتي-تشات" أول مورد واسع النطاق لدراسة منهجية للأسئلة المفتوحة الواقعية الموجهة إلى نماذج اللغة، وتكشف عن رؤى حاسمة تُوجّه الأبحاث المستقبلية في تقليل المخاطر الأمنية طويلة الأجل التي تطرحها ظاهرة "العقل الجماعي الاصطناعي".

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

العقل الجماعي الاصطناعي: التجانس غير المحدود للنماذج اللغوية (وأبعد من ذلك)

Liwei Jiang Yuanjun Chai Margaret Li Mickel Liu Raymond Fok Nouha Dziri Yulia Tsvetkov Maarten Sap Alon Albalak Yejin Choi

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

العقل الجماعي الاصطناعي: التجانس غير المحدود للنماذج اللغوية (وأبعد من ذلك)

Liwei Jiang Yuanjun Chai Margaret Li Mickel Liu Raymond Fok Nouha Dziri Yulia Tsvetkov Maarten Sap Alon Albalak Yejin Choi

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

العقل الجماعي الاصطناعي: التجانس غير المحدود للنماذج اللغوية (وأبعد من ذلك)

Liwei Jiang Yuanjun Chai Margaret Li Mickel Liu Raymond Fok Nouha Dziri Yulia Tsvetkov Maarten Sap Alon Albalak Yejin Choi

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters