Command Palette
Search for a command to run...
مجموعة بيانات المصطلحات الصينية واسعة النطاق ChID
Date
Size
Publish URL
Paper URL
بسبب الافتقار إلى مجموعات غنية من النصوص، فإن الأبحاث حول فهم القراءة الصينية القائمة على الاختصارات لا تزال محدودة. ChID (مجموعة بيانات التعابير الاصطلاحية الصينية) عبارة عن مجموعة بيانات اختبارية واسعة النطاق تستخدم لدراسة فهم التعابير الاصطلاحية، وهي ظاهرة لغوية فريدة من نوعها في اللغة الصينية. في هذه المجموعة، يتم استبدال العبارات الاصطلاحية في المقالات برموز فارغة، ويجب اختيار الإجابات الصحيحة من العبارات الاصطلاحية المرشحة المصممة بعناية.
تحتوي مجموعة البيانات على 581 ألف فقرة و729 ألف فراغ، وتغطي مجالات متعددة. في ChID، يتم استبدال العبارات الاصطلاحية في الفقرات بمسافات بيضاء. بالنسبة لكل فراغ، يتم توفير قائمة من العبارات المرشحة بما في ذلك العبارة الذهبية كخيار.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.