HyperAIHyperAI

Command Palette

Search for a command to run...

PaddleOCR-VL: تحليل المستندات متعدد الوسائط

Date

منذ 2 أشهر

Size

21.34 MB

Tags

License

Apache 2.0

Paper URL

2510.14528

1. مقدمة البرنامج التعليمي

مستودع

PaddleOCR-VL هو نموذج متطور وفعال من حيث استهلاك الموارد، مصمم خصيصًا لمهام تحليل المستندات. يتكون أساسًا من PaddleOCR-VL-0.9B، وهو نموذج لغة مرئي (VLM) صغير الحجم وقوي، يدمج مُشفِّرًا مرئيًا ديناميكي الدقة على غرار NaViT مع نموذج اللغة ERNIE-4.5-0.3B، مما يُمكّن من التعرف الدقيق على العناصر. يدعم هذا النموذج المبتكر 109 لغات بكفاءة، ويتفوق في التعرف على العناصر المعقدة مثل النصوص والجداول والصيغ والرسوم البيانية، مع الحفاظ على استهلاك منخفض للغاية للموارد. من خلال تقييم شامل على معايير عامة وداخلية شائعة الاستخدام، حقق PaddleOCR-VL أداءً متميزًا في كلٍ من تحليل المستندات على مستوى الصفحة والتعرف على العناصر. يتفوق هذا النموذج بشكل ملحوظ على الحلول الحالية، ويُظهر قدرة تنافسية عالية ضد نماذج اللغة المرئية الرائدة، ويُوفر سرعات استدلال فائقة. هذه المزايا تجعله مناسبًا جدًا للتطبيق العملي. تتوفر أوراق بحثية ذات صلة. PaddleOCR-VL: تعزيز تحليل المستندات متعددة اللغات عبر نموذج بصري لغوي فائق الصغر بحجم 0.9B .

يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد حوسبة.

2. أمثلة على التأثيرات

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

كيفية الاستخدام 

 

معلومات الاستشهاد

@misc{cui2025paddleocrvlboostingmultilingualdocument,
      title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model}, 
      author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
      year={2025},
      eprint={2510.14528},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2510.14528}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
PaddleOCR-VL: تحليل المستندات متعدد الوسائط | Notebooks | HyperAI