HyperAIHyperAI

Command Palette

Search for a command to run...

HunyuanOCR: التعرف الضوئي على الحروف (OCR) الشامل من Tencent Hunyuan

Date

منذ 5 أيام

Size

525.58 MB

Tags

Paper URL

arxiv.org

1. مقدمة البرنامج التعليمي

رخصة

تم إطلاق مشروع HunyuanOCR من قبل فريق Hunyuan التابع لشركة Tencent في نوفمبر 2025، وفيما يلي نتائج الورقة البحثية ذات الصلة:تقرير فني HunyuanOCR".

نظرة عامة على المشروع: HunyuanOCR هو نموذج ثوري للتعرف الضوئي على الأحرف (OCR) من البداية إلى النهاية، يعتمد على مليار مُعامل. وبفضل بنيته متعددة الوسائط الأصلية، يتجاوز هذا النموذج عملية التعرف الضوئي على الأحرف التقليدية المعقدة، والتي تتطلب الكشف والتمييز والدمج، ليُحقق تجربة مثالية تتمثل في "إدخال صورة واحدة، وإخراج مباشر". وقد حقق هذا النموذج نتائج متميزة في مهام مثل تحليل المستندات متعددة اللغات، والتعرف على صيغ LaTeX، وإعادة بناء الجداول المعقدة.

يشرح هذا البرنامج التعليمي قوة الحوسبة على منصة OpenBayes باستخدام وحدة معالجة رسومية واحدة من نوع RTX 5090 كمورد تجريبي. وهو يجمع بين الاستدلال الأصلي لـ Transformers وواجهة ويب مرئية مبنية باستخدام Grado، مما يدعم اختبار مهام التعرف الضوئي على الأحرف المختلفة بنقرة واحدة.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. تحميل الصور والتعرف عليها على صفحة الويب.

إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التحميل. يُرجى الانتظار لمدة دقيقتين إلى ثلاث دقائق ثم تحديث الصفحة.

معلومات الاستشهاد

@misc{hunyuanvisionteam2025hunyuanocrtechnicalreport,
      title={HunyuanOCR Technical Report}, 
      author={Hunyuan Vision Team and Pengyuan Lyu and Xingyu Wan and Gengluo Li and Shangpin Peng and Weinong Wang and Liang Wu and Huawen Shen and Yu Zhou and Canhui Tang and Qi Yang and Qiming Peng and Bin Luo and Hower Yang and Xinsong Zhang and Jinnian Zhang and Houwen Peng and Hongming Yang and Senhao Xie and Longsha Zhou and Ge Pei and Binghong Wu and Kan Wu and Jieneng Yang and Bochao Wang and Kai Liu and Jianchen Zhu and Jie Jiang and Linus and Han Hu and Chengquan Zhang},
      year={2025},
      journal={arXiv preprint arXiv:2511.19575},
      url={[https://arxiv.org/abs/2511.19575](https://arxiv.org/abs/2511.19575)}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
HunyuanOCR: التعرف الضوئي على الحروف (OCR) الشامل من Tencent Hunyuan | Notebooks | HyperAI