كشف البُعد الجوهري للنصوص: من الملخص الأكاديمي إلى القصة الإبداعية
Vladislav Pedashenko Laida Kushnareva Yana Khassan Nibal Eduard Tulchinskii Kristian Kuznetsov Vladislav Zharchinskii Yury Maximov Irina Piontkovskaya

الملخص
فيما يلي ترجمة النص إلى اللغة العربية، مع مراعاة الدقة التقنية والصياغة الأكاديمية الرسمية:يُعَد «البعد الجوهري» (Intrinsic Dimension - ID) أداةً حيوية في التحليل الحديث للنماذج اللغوية الكبيرة (LLMs)، حيث يرفد دراسات ديناميكيات التدريب، وسلوك التوسع، وهيكلية مجموعات البيانات بمعلومات قيّمة، إلا أن محدداته النصية لا تزال غير مستكشفة بشكل كافٍ. نُقدم في هذا البحث أول دراسة شاملة تؤسس البعد الجوهري (ID) بناءً على خصائص نصية قابلة للتفسير، وذلك من خلال تحليل التشفير المتقاطع (cross-encoder analysis)، والسمات اللغوية، وأجهزة التشفير التلقائي المتناثرة (SAEs).نرسخ في هذا العمل ثلاث نتائج رئيسية:أولاً، يُعتبر البعد الجوهري مكملاً للمقاييس القائمة على الإنتروبيا (entropy-based metrics): فبعد تحييد عامل الطول، لا يظهر ترابط بين المقياسين، حيث يلتقط البعد الجوهري تعقيداً هندسياً متعامداً (مستقلاً) عن جودة التنبؤ.ثانياً، يُظهر البعد الجوهري تمايزاً طبقياً قوياً حسب النوع النصي: إذ يُسجل النثر العلمي بعداً جوهرياً منخفضاً (حوالي 8)، والمحتوى الموسوعي بعداً متوسطاً (حوالي 9)، في حين تُسجل الكتابة الإبداعية/كتابة الرأي بعداً جوهرياً مرتفعاً (حوالي 10.5) عبر جميع النماذج التي تم اختبارها. ويكشف هذا أن النماذج اللغوية الكبيرة المعاصرة تجد النصوص العلمية "بسيطة تمثيلياً" (representationally simple)، بينما يتطلب الأدب الخيالي درجات حرية إضافية.ثالثاً، باستخدام أجهزة التشفير التلقائي المتناثرة (SAEs)، حددنا سمات سببية: فالإشارات العلمية (النبرة الرسمية، قوالب التقارير، الإحصاءات) تعمل على تقليل البعد الجوهري؛ بينما تؤدي الإشارات ذات الطابع الإنساني (الشخصنة، العاطفة، السرد) إلى زيادته. وقد أكدت تجارب التوجيه (steering experiments) أن هذه التأثيرات سببية.وهكذا، بالنسبة للنماذج المعاصرة، تبدو الكتابة العلمية "سهلة" نسبياً، في حين يضيف الخيال والرأي والعاطفة درجات حرية تمثيلية. ويوفر تحليلنا متعدد الأوجه توجيهاً عملياً للاستخدام الصحيح للبعد الجوهري والتفسير السليم للنتائج المستندة إليه.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.