مجموعة بيانات صور المشهد الطبيعي من SynthText
تتكون مجموعة بيانات SynthText من صور المشاهد الطبيعية التي تحتوي على كلمات. يتم استخدامه بشكل أساسي لاكتشاف النصوص في المشاهد الطبيعية. تتكون مجموعة البيانات من 800000 صورة وتحتوي على ما يقرب من 8 ملايين مثيل للكلمات الاصطناعية.
يتم توضيح كل مثيل نصي باستخدام مربعات حدودية على مستوى سلسلة النص، وعلى مستوى الكلمة، وعلى مستوى الحرف.
تم نشر مجموعة بيانات SynthText بواسطة Gupta، A. وVedaldi، A. وZisserman، A. من مجموعة الهندسة البصرية، قسم علوم الهندسة، جامعة أكسفورد، في مؤتمر IEEE حول رؤية الكمبيوتر والتعرف على الأنماط (CVPR) في عام 2016.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.