Command Palette
Search for a command to run...
مجموعة بيانات كتب المؤسسات 1.0
الكتب المؤسسية 1.0 هي مجموعة متنامية من الكتب المتاحة في المجال العام والتي من المقرر أن تصدرها جامعة هارفارد في عام 2025. نتائج البحث ذات الصلة هي:الكتب المؤسسية 1.0: مجموعة بيانات رمزية بحجم 242 مليار من مجموعات مكتبة هارفارد، تم تحسينها من أجل الدقة وسهولة الاستخدام". تتكون مجموعة البيانات من 983,004 كتابًا متاحًا للعامة بـ 254 لغة، نُشر معظمها في القرنين التاسع عشر والعشرين. تحتوي مجموعة البيانات على 242 مليار رمز، و386 مليون صفحة نصية، وهي متوفرة بصيغتي تصدير OCR الأصلية والمُعالجة.
الاستشهاد
@misc{cargnelutti2025institutionalbooks10242b, title={Institutional Books 1.0: A 242B token dataset from Harvard Library's collections, improved for accuracy and usability}, المؤلفون: {ماتيو كارغنيلوتي وكاثرين بروبستون وجون هيس وجاك كوشمان وكريستي موك وأريستانا سكورتاس وكايل كورتني وجريج ليبرت وأماندا واتسون ومارثا وايتهيد وجوناثان زيتراين}، year={2025}, eprint={2506.08300}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2506.08300}, }
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.