HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات المصطلحات الصينية واسعة النطاق ChID

التاريخ

منذ عام واحد

الحجم

328.62 MB

المؤسسة

جامعة تسينغهوا

رابط النشر

github.com

رابط الورقة البحثية

arxiv.org

بسبب الافتقار إلى مجموعات غنية من النصوص، فإن الأبحاث حول فهم القراءة الصينية القائمة على الاختصارات لا تزال محدودة. ChID (مجموعة بيانات التعابير الاصطلاحية الصينية) عبارة عن مجموعة بيانات اختبارية واسعة النطاق تستخدم لدراسة فهم التعابير الاصطلاحية، وهي ظاهرة لغوية فريدة من نوعها في اللغة الصينية. في هذه المجموعة، يتم استبدال العبارات الاصطلاحية في المقالات برموز فارغة، ويجب اختيار الإجابات الصحيحة من العبارات الاصطلاحية المرشحة المصممة بعناية.

تحتوي مجموعة البيانات على 581 ألف فقرة و729 ألف فراغ، وتغطي مجالات متعددة. في ChID، يتم استبدال العبارات الاصطلاحية في الفقرات بمسافات بيضاء. بالنسبة لكل فراغ، يتم توفير قائمة من العبارات المرشحة بما في ذلك العبارة الذهبية كخيار.

ChID.torrent
البذر 1التنزيل 0مكتمل 171إجمالي التنزيلات 256
  • ChID/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • chid.zip
          328.62 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp