مجموعة بيانات التفكير الروائي LongPage
LongPage هي أول مجموعة بيانات شاملة تصدرها شركة Pageshift-Entertainment في عام 2025 لتدريب نماذج الذكاء الاصطناعي على كتابة روايات كاملة ذات قدرات تفكير معقدة.
تحتوي هذه المجموعة حاليًا على عينات من حوالي 300 كتاب، يتراوح عدد كلمات كل منها بين 40,000 وأكثر من 600,000 كلمة، وتغطي الروايات القصيرة والروايات الملحمية. تتضمن بنية البيانات أدلة تخطيط متعددة المستويات، مثل نماذج الشخصيات، ومسارات القصة، وقواعد العالم، وتحليل المشاهد، بالإضافة إلى بيانات وصفية هيكلية، مثل كثافة الحوار، ووتيرة السرد، وتركيز السرد. تتضمن كل عينة حثًا، وسلسلة أفكار، وبنية الرواية الكاملة (الكتاب). تدعم هذه البيانات عمليات التدريب، بدءًا من الضبط الدقيق المُشرف عليه من البداية وحتى التعلم التعزيزي، مما يجعلها مناسبة لتدريب نماذج لغوية واسعة النطاق ذات قدرات تفكير هرمية، وتحسين تماسك وتخطيط الكتابة الطويلة.