HyperAI超神経

ドクリング: ドキュメント解析アーティファクト

GitHub
星

1. チュートリアルの概要

ドクリング

ドクリング  これは、IBM が 2024 年に開始したオープンソースの多機能ドキュメント変換ツールで、ドキュメント形式の変換プロセスの簡素化と自動化を目的としています。さまざまな一般的なファイル形式 (PDF、Word、PPTX、Markdown など) から、テキスト (Text)、Markdown、Doctags、JSON、YAML などのさまざまな出力形式への変換をサポートします。

Docling はドキュメントの変換と処理にモジュール設計を採用しており、さまざまなニーズを満たすために必要に応じてさまざまな変換モードを置き換えることができます。

主な機能:

  • 複数のドキュメント形式の変換をサポート 文章マークダウンドクタグJSONYAML 形式。
  • PDF、DOCX、PPTX、MD、ASCIIDOC などの複数の入力形式をサポートします。
  • 他のアプリケーションとの統合を容易にする、明確で簡潔なインターフェイスを提供します。
  • Gradio を介したビジュアル インターフェイスの構築をサポートし、ユーザーが対話型のファイル アップロードと変換操作を実行できるようにします。

サポートされているファイル形式:

  • PDF: テキスト、マークダウン、Doctag、JSON、YAML 形式に変換可能。
  • DOCX: テキスト、マークダウン、Doctag、JSON、YAML 形式に変換可能。
  • PPTX: テキスト、マークダウン、Doctag、JSON、YAML 形式に変換可能。
  • マークダウン: テキスト、マークダウン、Doctag、JSON、YAML 形式に変換可能。
  • アスキードック: JSON および YAML 形式に変換可能。

2. 操作手順

1. コンテナを起動します

通过 API 地址进入 Web 界面
ウェブインターフェース

2. ファイル変換

进入 web 界面后,按照以下步骤进行操作:
照明制御手順

3. 交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、バックグラウンドで推奨するメッセージを残してください。さらに、チュートリアル交換グループも設立しました。QR コードをスキャンしてグループに参加し、技術的な問題について話し合ったり、アプリケーションの効果を共有したりすることができます。

グループに参加する