运行此教程在 Discord 上讨论

日期

8 个月前

大小

18.79 MB

标签

许可证

Apache 2.0

GitHub

NanoNets/docext

一、教程简介

Build

Nanonets-OCR-s 是由 Nanonets 于 2025 年 6 月 10 日发布的光学字符识别（OCR）模型。普通的 OCR 技术主要聚焦于从图像中提取纯文本，而 Nanonets-OCR-s 更进一步，它能识别文档中的多种元素，比如数学公式、图片、签名、水印、复选框和表格，并将它们整理成结构化的 Markdown 格式。这种能力让它在处理复杂文档时表现出色，比如学术论文、法律文件或商业报表。它的输出不仅便于人类阅读，还为下游的自动化处理提供了坚实基础。

本教程采用资源为单卡 RTX 4090 。该教程包含两个功能：1 、从文档中提取信息。 2 、图像和 PDF 转成 Markdown 。

二、项目示例

三、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面

2. 使用步骤

若显示「Bad Gateway」，这表示模型正在初始化，由于模型较大，请等待约 1-2 分钟后刷新页面。

2.1 从文档中提取信息

2.2 图像和 PDF 转成 Markdown

四、交流探讨

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

运行此教程在 Discord 上讨论

日期

8 个月前

大小

18.79 MB

标签

许可证

Apache 2.0

GitHub

NanoNets/docext

一、教程简介

Build

Nanonets-OCR-s 是由 Nanonets 于 2025 年 6 月 10 日发布的光学字符识别（OCR）模型。普通的 OCR 技术主要聚焦于从图像中提取纯文本，而 Nanonets-OCR-s 更进一步，它能识别文档中的多种元素，比如数学公式、图片、签名、水印、复选框和表格，并将它们整理成结构化的 Markdown 格式。这种能力让它在处理复杂文档时表现出色，比如学术论文、法律文件或商业报表。它的输出不仅便于人类阅读，还为下游的自动化处理提供了坚实基础。

本教程采用资源为单卡 RTX 4090 。该教程包含两个功能：1 、从文档中提取信息。 2 、图像和 PDF 转成 Markdown 。

二、项目示例

三、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面

2. 使用步骤

若显示「Bad Gateway」，这表示模型正在初始化，由于模型较大，请等待约 1-2 分钟后刷新页面。

2.1 从文档中提取信息

2.2 图像和 PDF 转成 Markdown

四、交流探讨

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供