一、教程简介

MiniCPM-V 4.5 是由清华大学自然语言处理实验室联合面壁智能于 2025 年 8 月开源的极致高效的端侧大模型。 MiniCPM-V 4.5 拥有 8B 参数。模型在图片、视频、 OCR 等多个领域表现卓越，尤其在高刷视频理解方面取得突破，能处理高刷新率视频并精准识别内容。模型支持混合推理模式，可平衡性能与响应速度。 MiniCPM-V 4.5 端侧部署友好，显存占用低，推理速度快，适合在车机、机器人等设备上应用，为端侧 AI 发展树立新标杆。相关论文成果为 MiniCPM-V: A GPT-4V Level MLLM on Your Phone 。

该教程算力资源采用单卡 RTX 4090 。

引用信息

本项目引用信息如下：

@article{yao2024minicpm, title={MiniCPM-V: A GPT-4V Level MLLM on Your Phone}, author={Yao, Yuan and Yu, Tianyu and Zhang, Ao and Wang, Chongyi and Cui, Junbo and Zhu, Hongji and Cai, Tianchi and Li, Haoyu and Zhao, Weilin and He, Zhihui and others}, journal={arXiv preprint arXiv:2408.01800}, year={2024} }

HyperAI

运行此教程在 Discord 上讨论

日期

5 个月前

大小

343.55 MB

标签

vLLM

许可证

Apache 2.0

GitHub

OpenBMB/MiniCPM-V

论文 URL

2408.01800

一、教程简介

该教程算力资源采用单卡 RTX 4090 。

二、效果展示

图像理解

多图像比较

OCR 文本提取

视频理解

三、运行步骤

1. 启动容器

2. 使用步骤

若显示「Bad Gateway」，这表示模型正在初始化，由于模型较大，请等待约 2-3 分钟后刷新页面。

四、交流探讨

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息

本项目引用信息如下：

@article{yao2024minicpm,
  title={MiniCPM-V: A GPT-4V Level MLLM on Your Phone},
  author={Yao, Yuan and Yu, Tianyu and Zhang, Ao and Wang, Chongyi and Cui, Junbo and Zhu, Hongji and Cai, Tianchi and Li, Haoyu and Zhao, Weilin and He, Zhihui and others},
  journal={arXiv preprint arXiv:2408.01800},
  year={2024}
}

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

运行此教程在 Discord 上讨论

日期

5 个月前

大小

343.55 MB

标签

vLLM

许可证

Apache 2.0

GitHub

OpenBMB/MiniCPM-V

论文 URL

2408.01800

一、教程简介

该教程算力资源采用单卡 RTX 4090 。

二、效果展示