Docling: أداة تحليل المستندات
1. مقدمة البرنامج التعليمي

Docling أداة تحويل مستندات مفتوحة المصدر ومتعددة الوظائف، أطلقتها IBM عام ٢٠٢٤، مصممة لتبسيط عملية تحويل صيغ المستندات وأتمتتها. تدعم تحويل مختلف صيغ الملفات الشائعة (مثل PDF وWord وPPTX وMarkdown وغيرها) إلى صيغ إخراج متنوعة، مثل Text وMarkdown وDoctags وJSON وYAML.
يعتمد Docling على تصميم معياري لتحويل المستندات ومعالجتها، ويمكن استبدال أوضاع التحويل المختلفة حسب الحاجة لتلبية المتطلبات المختلفة.
المميزات الرئيسية:
- يدعم تحويل تنسيقات المستندات المتعددة إلى نص ، تخفيض السعر ، علامات الوثائق ، JSON ، يامل شكل.
- يدعم تنسيقات الإدخال المتعددة، بما في ذلك PDF، DOCX، PPTX، MD، ASCIIDOC، وما إلى ذلك.
- يوفر واجهة واضحة وموجزة للتكامل السهل مع التطبيقات الأخرى.
- يدعم إنشاء واجهة مرئية من خلال Gradio، مما يسمح للمستخدمين بإجراء عمليات تحميل الملفات وتحويلها بشكل تفاعلي.
تنسيقات الملفات المدعومة:
- ملف بي دي إف:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
- دوككس:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
- PPTX:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
- تخفيض السعر:يمكن تحويلها إلى تنسيقات النص، وMarkdown، وDoctags، وJSON، وYAML.
- أسكيدوك:يمكن تحويلها إلى تنسيقات JSON وYAML.
2. خطوات التشغيل
1. ابدأ تشغيل الحاوية
通过 API 地址进入 Web 界面

2. تحويل الملفات
进入 web 界面后,按照以下步骤进行操作:

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.