HyperAIHyperAI

Command Palette

Search for a command to run...

DiffusionSTR: نموذج التشتت للتعرف على النص في المشهد

Masato Fujitake

الملخص

تقدم هذه الورقة البحثية نموذج التوزيع للقراءة النصية في المشاهد (DiffusionSTR)، وهو إطار عمل للقراءة النصية من النهاية إلى النهاية يستخدم نماذج التوزيع لتمييز النصوص في البيئات الواقعية. في حين أن الدراسات السابقة رأت مهمة قراءة النصوص في المشاهد كتحويل من صورة إلى نص، فإننا نعيد التفكير في هذه المهمة على أنها عملية تحويل نصي-نصي ضمن سياق صورة، باستخدام نموذج التوزيع. ونُظهر لأول مرة إمكانية تطبيق نموذج التوزيع على قراءة النصوص. علاوة على ذلك، تُظهر النتائج التجريبية على مجموعات بيانات متاحة للجمهور أن الطريقة المقترحة تحقق دقة تنافسية مقارنة بالطرق الرائدة في مجالها.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp