HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات المصطلحات الصينية واسعة النطاق ChID

التاريخ

منذ 2 أعوام

الحجم

328.62 MB

المؤسسة

جامعة تسينغهوا

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

بسبب الافتقار إلى مجموعات غنية من النصوص، فإن الأبحاث حول فهم القراءة الصينية القائمة على الاختصارات لا تزال محدودة. ChID (مجموعة بيانات التعابير الاصطلاحية الصينية) عبارة عن مجموعة بيانات اختبارية واسعة النطاق تستخدم لدراسة فهم التعابير الاصطلاحية، وهي ظاهرة لغوية فريدة من نوعها في اللغة الصينية. في هذه المجموعة، يتم استبدال العبارات الاصطلاحية في المقالات برموز فارغة، ويجب اختيار الإجابات الصحيحة من العبارات الاصطلاحية المرشحة المصممة بعناية.

تحتوي مجموعة البيانات على 581 ألف فقرة و729 ألف فراغ، وتغطي مجالات متعددة. في ChID، يتم استبدال العبارات الاصطلاحية في الفقرات بمسافات بيضاء. بالنسبة لكل فراغ، يتم توفير قائمة من العبارات المرشحة بما في ذلك العبارة الذهبية كخيار.

ChID.torrent
البذر 1جارٍ التنزيل 0مكتمل 187إجمالي التنزيلات 309
  • ChID/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • chid.zip
          328.62 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp