HyperAIHyperAI

Command Palette

Search for a command to run...

تحليل صور المستندات متعددة الوسائط في Dolphin

1. مقدمة البرنامج التعليمي

يبني

دولفين هو نموذج تحليل مستندات متعدد الوسائط، أطلقه فريق بايت دانس في مايو 2025. يعتمد النموذج على نهج من مرحلتين، حيث يتم تحليل البنية أولاً ثم المحتوى. تُولّد المرحلة الأولى سلسلة من عناصر تخطيط المستند، بينما تستخدم المرحلة الثانية هذه العناصر كمرسيات لتحليل المحتوى بالتوازي. يُظهر دولفين أداءً ممتازًا في مختلف مهام تحليل المستندات، متفوقًا على نماذج مثل GPT-4.1 وMistral-OCR. نتائج البحث ذات الصلة هي:دولفين: تحليل صور المستندات عبر توجيهات المرساة غير المتجانسة". مقبولة بموجب ACL 2025.

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. أمثلة الاستخدام

التعرف على المستندات

 نتيجة 

التعرف على العناصر

نتيجة 

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@inproceedings{dolphin2025,
  title={Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting},
  author={Feng, Hao and Wei, Shu and Fei, Xiang and Shi, Wei and Han, Yingdong and Liao, Lei and Lu, Jinghui and Wu, Binghong and Liu, Qi and Lin, Chunhui and Tang, Jingqun and Liu, Hao and Huang, Can},
  year={2025},
  booktitle={Proceedings of the 65rd Annual Meeting of the Association for Computational Linguistics (ACL)}
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp