Microsoftのオープンソースドキュメント変換ツール、MarkItDown
1. チュートリアルの概要

MarkItDown は、2025 年 8 月に Microsoft チームによってリリースされた軽量のプラグアンドプレイ Python ドキュメント変換ツールです。さまざまな一般的なドキュメントおよびリッチ メディア形式を効率的かつ構造的に Markdown に変換し、大規模言語モデル (LLM) のテキスト理解および分析パイプライン向けに最適化された入力形式を提供することを目的としています。
このツールは、複雑な形式の文書(PDFやPPTなど)をプレーンテキストに変換する際の構造情報の損失や意味要素の欠落といった根本的な問題を体系的に解決します。人間が読むための視覚的な忠実度を追求するのではなく、下流のAI処理のために主要な文書の論理構造(タイトル、リスト、表、リンクなど)が確実に保持されることを優先し、形式の互換性、構造の忠実度、処理効率のバランスを実現します。
このチュートリアルでは、デフォルトのリソースとして単一の RTX 5090 グラフィック カードを使用します。
2. プロジェクト例

3. 操作手順
1. コンテナを起動します

2. ウェブページに入ったら、モデルを使用することができます
「Bad Gateway」と表示される場合は、モデルが初期化中であることを意味します。2~3分お待ちいただき、ページを更新してください。PDF、PowerPoint(.pptx)、Word(.docx)、Excel(.xlsx)、HTML、画像(OCR)、音声(音声文字変換)、ZIPアーカイブ、YouTube動画リンク、EPUB電子書籍、各種テキスト形式(CSV / JSON / XML)をサポートしています。
