Docling: Tool Zur Dokumentanalyse
1. Einführung in das Tutorial

Docling Es handelt sich um ein multifunktionales Open-Source-Tool zur Dokumentkonvertierung, das 2024 von IBM auf den Markt gebracht wurde und darauf abzielt, den Prozess der Dokumentformatkonvertierung zu vereinfachen und zu automatisieren. Es unterstützt die Konvertierung mehrerer gängiger Dateiformate (wie PDF, Word, PPTX, Markdown usw.) in mehrere verschiedene Ausgabeformate wie Text, Markdown, Doctags, JSON und YAML.
Docling verwendet ein modulares Design für die Dokumentkonvertierung und -verarbeitung und verschiedene Konvertierungsmodi können nach Bedarf ersetzt werden, um unterschiedliche Anforderungen zu erfüllen.
Hauptmerkmale:
- Unterstützt die Konvertierung mehrerer Dokumentformate in Text , Markdown , Doctags , JSON , YAML Format.
- Unterstützt mehrere Eingabeformate, einschließlich PDF, DOCX, PPTX, MD, ASCIIDOC usw.
- Es bietet eine klare und übersichtliche Schnittstelle für die einfache Integration mit anderen Anwendungen.
- Unterstützt den Aufbau einer visuellen Schnittstelle über Gradio, die es Benutzern ermöglicht, interaktive Datei-Upload- und Konvertierungsvorgänge durchzuführen.
Unterstützte Dateiformate:
- PDF: Kann in die Formate Text, Markdown, Doctags, JSON und YAML konvertiert werden.
- DOCX: Kann in die Formate Text, Markdown, Doctags, JSON und YAML konvertiert werden.
- PPTX: Kann in die Formate Text, Markdown, Doctags, JSON und YAML konvertiert werden.
- Markdown: Kann in die Formate Text, Markdown, Doctags, JSON und YAML konvertiert werden.
- ASCIIDOC: Kann in die Formate JSON und YAML konvertiert werden.
2. Bedienungsschritte
1. Starten Sie den Container
通过 API 地址进入 Web 界面

2. Dateikonvertierung
进入 web 界面后,按照以下步骤进行操作:

3. Austausch und Diskussion
🖌️ Wenn Sie ein hochwertiges Projekt finden, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Alle sind herzlich eingeladen, den QR-Code zu scannen, um der Gruppe beizutreten, [SD-Tutorial] zu kommentieren, technische Probleme mit allen zu besprechen und Anwendungsergebnisse zu teilen!
