HyperAIHyperAI

Command Palette

Search for a command to run...

DeepSeek-OCR: "الضغط البصري" يحل محل التعرف التقليدي على الأحرف

1. مقدمة البرنامج التعليمي

يبني

يُمثل DeepSeek-OCR، الذي أصدرته شركة DeepSeek Inc. في أكتوبر 2025، دراسةً أوليةً حول جدوى ضغط السياقات الطويلة من الصور. يهدف DeepEncoder، المحرك الأساسي، إلى الحفاظ على مستويات تنشيط منخفضة مع تحقيق نسبة ضغط عالية عند إدخال عالي الدقة، مما يضمن بقاء عدد الرموز المرئية ضمن نطاق مُحسَّن وقابل للتحكم. تُظهر التجارب أنه عندما لا يتجاوز عدد الرموز النصية 10 أضعاف عدد الرموز المرئية (أي نسبة الضغط أقل من 10x)، يحقق النموذج دقة فك تشفير (OCR) تبلغ 971 TP3T. حتى عند نسبة ضغط 20x، تبقى دقة OCR حوالي 601 TP3T. يُظهر هذا واعدًا كبيرًا في اتجاهات بحثية مثل ضغط السياقات الطويلة للوثائق التاريخية وآليات تدهور الذاكرة في النماذج الكبيرة. عنوان الورقة البحثية ذات الصلة "...".DeepSeek-OCR: الضغط البصري للسياقات".

يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد افتراضي، ولكن يمكن استخدام بطاقة رسوميات RTX 4090 واحدة على الأقل لبدء البرنامج.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بعد الدخول إلى صفحة الويب، يمكنك تحميل الصور وتحليل النص.

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

كيفية الاستخدام

 3. نتائج الإخراج 

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{wei2025deepseek,
  title={DeepSeek-OCR: Contexts Optical Compression},
  author={Wei, Haoran and Sun, Yaofeng and Li, Yukun},
  journal={arXiv preprint arXiv:2510.18234},
  year={2025}
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
DeepSeek-OCR: "الضغط البصري" يحل محل التعرف التقليدي على الأحرف | الدروس | HyperAI