قاعدة بيانات الوثائق الاصطناعية SESYD
التاريخ
الحجم
رابط النشر
SESYD (الوثائق الاصطناعية لتقييم الأنظمة) عبارة عن قاعدة بيانات وثائق اصطناعية تحتوي على صور وثائقية تحتوي على معلومات حقيقية أساسية. ترتكز هذه القاعدة البيانات على مشكلتين بحثيتين رئيسيتين في مجال تحليل صور المستندات: (1) التعرف على الرموز وتحديد موقعها في صور الرسم عبر الإنترنت (مثل مخططات الطوابق ومخططات الدوائر)؛ (2) تقسيم الشخصيات والتعرف عليها في الخرائط الجغرافية. تتكون قاعدة بيانات SESYD من 11 مجموعة لتقييم الأداء، تحتوي على 284 ألف صورة، و190 ألف رمز، و284 ألف حرف. تم نشر قاعدة البيانات بواسطة ماثيو ديلالاندر، وإرنست فالفيني، وتوني بريدمور، وديموستينيس كاراتزاس، ونتائج الورقة ذات الصلة هي "إنشاء مستندات تركيبية لتقييم أداء أنظمة التعرف على الرموز وتحديدها"منذ إصدارها في عام 2010، أصبحت قاعدة بيانات رئيسية في مجال تحليل صور المستندات وتم الاستشهاد بها مئات المرات في أوراق البحث.
