HyperAIHyperAI

Command Palette

Search for a command to run...

SUT: مجموعة بيانات توليدية متعددة الأغراض جديدة لتحليل صور المستندات الفارسية

Hossein Nezamabadi-pour Ali Afkari Fahandari Fatemeh sadat Eslami Elham Shabaninia

الملخص

يقدم هذا البحث مجموعة بيانات كبيرة جديدة لصور المستندات الفارسية، تُسمى SUT، وتهدف إلى التصدي للتحديات المرتبطة بجمع بيانات حقيقية متنوعة وغنية لتمكين النماذج المراقبة في مهام تحليل صور المستندات (DIA)، مثل تصنيف صور المستندات، وكشف النصوص وتمييزها، واسترجاع المعلومات. تتكوّن المجموعة من 62,453 صورة تم تصنيفها إلى 21 فئة مختلفة، تشمل وثائق هوية تحتوي على معلومات شخصية تم إنشاؤها بشكل اصطناعي وتُركب على خلفيات متنوعة. كما تتضمن المجموعة ملفات مساعدة تحتوي على معلومات التسمية الخاصة بالصور. وتم تنظيم بيانات الحقيقة الأساسية في ملفات CSV تحتوي على مسارات الصور المجمعة والمعلومات المرتبطة بالبيانات المضمنة. ولإثبات فعالية مجموعة بيانات SUT في مهام تحليل صور المستندات، تم استخدامها في تصنيف المستندات (وحقق نموذج الشبكة العصبية التلافيفية دقة قدرها 86٪)، وفي التعرف البصري على النصوص (وحقق محركا Tesseract وEasyOCR معدل خطأ حروف (CER) قدره 0.083 و0.072 على التوالي). تمثل مجموعة بيانات SUT موردًا قيّمًا للباحثين المهتمين بتطوير وتقييم النماذج المراقبة في مجال تحليل صور المستندات الفارسية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
SUT: مجموعة بيانات توليدية متعددة الأغراض جديدة لتحليل صور المستندات الفارسية | مستندات | HyperAI