HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات المصطلحات الصينية واسعة النطاق ChID

Date

منذ عام واحد

Size

328.62 MB

Organization

جامعة تسينغهوا

Publish URL

github.com

Paper URL

arxiv.org

بسبب الافتقار إلى مجموعات غنية من النصوص، فإن الأبحاث حول فهم القراءة الصينية القائمة على الاختصارات لا تزال محدودة. ChID (مجموعة بيانات التعابير الاصطلاحية الصينية) عبارة عن مجموعة بيانات اختبارية واسعة النطاق تستخدم لدراسة فهم التعابير الاصطلاحية، وهي ظاهرة لغوية فريدة من نوعها في اللغة الصينية. في هذه المجموعة، يتم استبدال العبارات الاصطلاحية في المقالات برموز فارغة، ويجب اختيار الإجابات الصحيحة من العبارات الاصطلاحية المرشحة المصممة بعناية.

تحتوي مجموعة البيانات على 581 ألف فقرة و729 ألف فراغ، وتغطي مجالات متعددة. في ChID، يتم استبدال العبارات الاصطلاحية في الفقرات بمسافات بيضاء. بالنسبة لكل فراغ، يتم توفير قائمة من العبارات المرشحة بما في ذلك العبارة الذهبية كخيار.

ChID.torrent
Seeding 1Downloading 0Completed 177Total Downloads 304
  • ChID/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • chid.zip
          328.62 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp