التاريخ

منذ 9 أشهر

الوسوم

OCR

RTX 5090

رابط الورقة البحثية

2504.16030

الترخيص

MIT

GitHub

bytedance/Dolphin9.0k

1. مقدمة البرنامج التعليمي

دولفين هو نموذج لتحليل المستندات متعددة الوسائط، أطلقته شركة بايت دانس في مايو 2025. يعتمد هذا النموذج على منهجية ثنائية المراحل: أولًا، يُنشئ سلسلة من عناصر تخطيط المستند؛ ثانيًا، يستخدم هذه العناصر كنقاط ارتكاز لتحليل المحتوى بالتوازي. يُظهر دولفين أداءً متميزًا في مختلف مهام تحليل المستندات، متفوقًا على نماذج مثل GPT-4.1 و Mistral-OCR. تتوفر أوراق بحثية ذات صلة. دولفين: تحليل صور المستندات عبر توجيهات المرساة غير المتجانسة وقد تم قبولها من قبل مؤتمر ACL 2025.

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. أمثلة الاستخدام

التعرف على المستندات

نتيجة

التعرف على العناصر

نتيجة

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@inproceedings{dolphin2025,
  title={Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting},
  author={Feng, Hao and Wei, Shu and Fei, Xiang and Shi, Wei and Han, Yingdong and Liao, Lei and Lu, Jinghui and Wu, Binghong and Liu, Qi and Lin, Chunhui and Tang, Jingqun and Liu, Hao and Huang, Can},
  year={2025},
  booktitle={Proceedings of the 65rd Annual Meeting of the Association for Computational Linguistics (ACL)}
}

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

نظرة عامة على Notebook

المستوى

مبتدئ

الموضوع

الذكاء الاصطناعي التوليدي الرؤية الحاسوبية الأوساط الأكاديمية العالمية الرائدة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

شغّل هذا الـNotebook ناقش على Discord