Nanonets-OCR2-3B: 複雑な文書内の視覚要素をより正確に解釈
1. チュートリアルの概要

Nanonets-OCR2-3B は、2025 年 10 月に Nanonets によってリリースされた画像から Markdown へのモデルです。Nanonets-OCR2-3B は、ドキュメントを構造化された Markdown に変換するだけでなく、インテリジェントなコンテンツ認識、セマンティック タグ付け、コンテキスト認識の視覚的な質問回答を活用して、複雑なドキュメントのより深い理解とより正確な解釈を提供します。
このチュートリアルでは、コンピューティング リソースとして単一の RTX 5090 グラフィック カードを使用します。
2. エフェクト表示

3. 操作手順
1. コンテナを起動します

2. 使用手順
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。
