HyperAIHyperAI

Command Palette

Search for a command to run...

النص الصيني في مجموعة بيانات الأحرف الصينية البرية

ناقش على Discord

التاريخ

منذ 3 أعوام

المؤسسة

جامعة تسينغهوا

عنوان URL للنشر

ctwdataset.github.io

رابط الورقة البحثية

arxiv.org

الترخيص

Other

Featured Image

"النص الصيني في البرية" عبارة عن مجموعة بيانات كبيرة تم إنشاؤها من النصوص الموجودة في الصور الطبيعية. تحتوي مجموعة البيانات هذه على 32,285 صورة تحتوي على 1,018,402 حرفًا صينيًا، وهو ما يتجاوز مجموعات البيانات السابقة بكثير. هذه الصور من Tencent Street View وتم الحصول عليها من عشرات المدن المختلفة في الصين دون أي غرض خاص.

تُعد هذه المجموعة من البيانات صعبة للغاية بسبب تنوعها وتعقيدها. يحتوي على نص مسطح، ونص مرتفع، ونص حضري، ونص ريفي، ونص منخفض السطوع، ونص بعيد، ونص مخفي جزئيًا، وما إلى ذلك.

بالنسبة لكل صورة، يتم شرح جميع الأحرف الصينية بواسطة خبراء. بالنسبة لكل حرف صيني، تقوم مجموعة البيانات بشرح الحرف الأساسي الخاص به، والمربع المحيط به، و6 سمات للإشارة إلى ما إذا كان محجوبًا، أو له خلفية معقدة، أو مشوهًا، أو نصًا ثلاثي الأبعاد، أو فنيًا، أو مكتوبًا بخط اليد.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp