HyperAI

Docling: أداة تحليل المستندات

جيثب
النجوم

1. مقدمة البرنامج التعليمي

دوكلينج

دوكلينج  إنها أداة تحويل مستندات متعددة الوظائف مفتوحة المصدر أطلقتها شركة IBM في عام 2024، وتهدف إلى تبسيط وأتمتة عملية تحويل تنسيق المستندات. إنه يدعم تحويل تنسيقات الملفات المتعددة الشائعة (مثل PDF، Word، PPTX، Markdown، وما إلى ذلك) إلى تنسيقات إخراج متعددة مختلفة، مثل النص، Markdown، Doctags، JSON وYAML.

يعتمد Docling على تصميم معياري لتحويل المستندات ومعالجتها، ويمكن استبدال أوضاع التحويل المختلفة حسب الحاجة لتلبية المتطلبات المختلفة.

المميزات الرئيسية:

  • يدعم تحويل تنسيقات المستندات المتعددة إلى نص ، تخفيض السعر ، علامات الوثائق ، JSON ، يامل شكل.
  • يدعم تنسيقات الإدخال المتعددة، بما في ذلك PDF، DOCX، PPTX، MD، ASCIIDOC، وما إلى ذلك.
  • يوفر واجهة واضحة وموجزة للتكامل السهل مع التطبيقات الأخرى.
  • يدعم إنشاء واجهة مرئية من خلال Gradio، مما يسمح للمستخدمين بإجراء عمليات تحميل الملفات وتحويلها بشكل تفاعلي.

تنسيقات الملفات المدعومة:

  • ملف بي دي إف:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
  • دوككس:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
  • PPTX:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
  • تخفيض السعر:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
  • أسكيدوك:يمكن تحويلها إلى تنسيقات JSON وYAML.

2. خطوات التشغيل

1. ابدأ تشغيل الحاوية

通过 API 地址进入 Web 界面
واجهة الويب

2. تحويل الملفات

进入 web 界面后,按照以下步骤进行操作:
خطوات التحكم في الإضاءة

3. التبادل والمناقشة

🖌️ إذا وجدت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. نرحب بالجميع لمسح رمز الاستجابة السريعة للانضمام إلى المجموعة، والتعليق على [برنامج تعليمي SD]، ومناقشة المشكلات الفنية مع الجميع، ومشاركة نتائج التطبيق!

انضم للمجموعة