SUT: مجموعة بيانات توليدية متعددة الأغراض جديدة لتحليل صور المستندات الفارسية
يقدم هذا البحث مجموعة بيانات كبيرة جديدة لصور المستندات الفارسية، تُسمى SUT، وتهدف إلى التصدي للتحديات المرتبطة بجمع بيانات حقيقية متنوعة وغنية لتمكين النماذج المراقبة في مهام تحليل صور المستندات (DIA)، مثل تصنيف صور المستندات، وكشف النصوص وتمييزها، واسترجاع المعلومات. تتكوّن المجموعة من 62,453 صورة تم تصنيفها إلى 21 فئة مختلفة، تشمل وثائق هوية تحتوي على معلومات شخصية تم إنشاؤها بشكل اصطناعي وتُركب على خلفيات متنوعة. كما تتضمن المجموعة ملفات مساعدة تحتوي على معلومات التسمية الخاصة بالصور. وتم تنظيم بيانات الحقيقة الأساسية في ملفات CSV تحتوي على مسارات الصور المجمعة والمعلومات المرتبطة بالبيانات المضمنة. ولإثبات فعالية مجموعة بيانات SUT في مهام تحليل صور المستندات، تم استخدامها في تصنيف المستندات (وحقق نموذج الشبكة العصبية التلافيفية دقة قدرها 86٪)، وفي التعرف البصري على النصوص (وحقق محركا Tesseract وEasyOCR معدل خطأ حروف (CER) قدره 0.083 و0.072 على التوالي). تمثل مجموعة بيانات SUT موردًا قيّمًا للباحثين المهتمين بتطوير وتقييم النماذج المراقبة في مجال تحليل صور المستندات الفارسية.