Command Palette

Search for a command to run...

Granite-docling-258M: 軽量マルチモーダルドキュメント処理モデル

1. チュートリアルの概要

Granite-Docling-258Mは、IBMが2025年9月に発表した軽量な視覚言語モデルであり、効率的なドキュメント変換を目的として設計されています。このモデルは、レイアウト、表、数式などの要素を完全に保持しながら、ドキュメントを機械可読形式に変換できます。このモデルはわずか258Mのパラメータで構成されており、優れたパフォーマンスとコスト効率を備え、多言語処理(アラビア語、中国語、日本語を含む)をサポートしています。このモデルはDocTags形式を使用してドキュメント構造を正確に記述し、情報の損失を回避します。Granite-Docling-258MはDoclingライブラリとシームレスに統合でき、強力なカスタマイズ機能とエラー処理機能を提供し、エンタープライズレベルのドキュメント処理に適しており、ドキュメント処理分野における強力なツールです。関連する論文結果は「SmolDocling: エンドツーエンドのマルチモーダルドキュメント変換のための超コンパクトなビジョン言語モデル」、関連ブログは「IBM Granite-Docling: 1つの小さなモデルでエンドツーエンドのドキュメント理解を実現”。

このチュートリアルでは、リソースとして単一の RTX 5090 カードを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Granite-docling-258M: 軽量マルチモーダルドキュメント処理モデル | チュートリアル | HyperAI超神経