MiniCPM5-1B 采用 RL+OPD 训练，多项复杂任务达 SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench 发布

2 个月前

MiniCPM5-1B 是由 OpenBMB 开源的一款专为端侧部署和资源受限场景设计的 10 亿参数级语言模型，也是 MiniCPM5 系列的首款模型。该模型基于标准 Llama 架构，引入了包含 <think> 标签的混合推理范式。此外，该模型借助先进的 RL+OPD 训练工艺，在大幅提升核心性能的同时有效消除了输出冗余。其原生支持 131K 超长上下文，并在智能体调用与代码合成等复杂任务中达到了 1B 级开源的 SOTA 水平。该模型有效规避了云端推理的延迟与隐私困境，为构建高效的本地化 AI 基座提供了理想方案。

目前，HyperAI 超神经官网已上线了「MiniCPM5-1B：面向端侧的高效 1B LLM」，快来试试吧~

在线使用：https://go.hyper.ai/OBlhv

欢迎登录官网查看更多内容：

https://hyper.ai

5 月 30 日- 6 月 05 日，hyper.ai 官网更新速览：

* 优质公共数据集：6 个

* 优质教程精选：5 个

* 社区文章解读：1 篇

* 热门百科词条：5 条

* 6 月截稿顶会：3 个

访问官网：hyper.ai

公共数据集精选

1. chi-bench 医疗智能体基准评测数据集

chi-bench 是由 Actava AI 于 2026 年发布的医疗智能体评测数据集。该数据集构建了一个高保真医疗业务仿真环境，集成 20 个通过 MCP（Model Context Protocol）开放接口的医疗应用系统并提供包含 1,279 份医疗运营文档的知识库，评测场景覆盖美国医疗体系中的预授权管理、医保 / 保险方利用率 Citation 管理和人群护理管理三大领域。

在线使用：https://go.hyper.ai/j8pCr

2. SMOL 多语言翻译平行数据集

SMOL 是由 Google 于 2025 年发布的专业翻译数据集。该数据集收录了阿姆哈拉语、斯瓦希里语、阿法尔语等 221 种语料、标注数据稀缺的小语种 / 地方语言的专业翻译文本，覆盖广泛的语言对，包含专业翻译与志愿者贡献的文本，并针对部分语言加入了医疗领域垂直数据与事实性标注。

在线使用：https://go.hyper.ai/84QS4

3. TACK 靶向嵌合体知识库数据集

TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨在解决现有 PROTAC 机器学习基准中数据稀缺、缺乏严格评估及覆盖范围有限的问题，广泛应用于 PROTAC 降解活性预测、靶向蛋白降解（TPD）研究、人工智能辅助药物发现（AIDD）、计算机辅助药物设计（CADD）、药物虚拟筛选、多任务学习、分子性质预测、图神经网络研究以及机器学习基准测试等领域。

在线使用：https://go.hyper.ai/7gDJu

4. EAVSD 电商广告视频分镜数据集

EAVSD 是由北京大学团队于 2026 年发布的电商广告视频分镜数据集，旨在支持面向主体的多图像生成与叙事规划任务。该数据集广泛应用于面向主体的多图像生成与叙事规划任务，核心聚焦电商广告视频分镜生成与可控长程视觉一致性研究。

在线使用：https://go.hyper.ai/hyzLx

5. DeepCrack 基础设施裂缝检测数据集

DeepCrack 是由武汉大学计算机视觉与遥感实验室提供的基础设施裂缝检测基准数据集，旨在为裂缝检测算法研究提供标准化、高精度的监督学习数据支持，可直接用于 U-Net 、 DeepLab 、 SegNet 等深度学习模型的训练与评估，广泛应用于结构健康监测、道路巡检与建筑缺陷识别等研究方向。

在线使用：https://go.hyper.ai/88zlH

6. World Air Pollution and AQI 全球空气质量与 AQI 数据集

World Air Pollution and AQI 是一份面向研究与数据分析的全球空气质量数据集。该数据集包含 2014 至 2025 年的月度城市级观测数据，总计 331,920 条记录，覆盖全球 5 大洲、中国、美国、英国、法国、德国、日本、韩国等 24 个国家。其中包括 24 个特征，包括空气污染物浓度、空气质量指数、气象变量以及社会环境指标。

在线使用：https://go.hyper.ai/QL8VK

公共教程精选

1. MiniCPM5-1B：面向端侧的高效 1B LLM

MiniCPM5-1B 是 OpenBMB 团队发布的 MiniCPM5 系列首个模型，面向端侧部署和资源受限场景，采用 1B 参数稠密 Transformer 架构，在同尺寸开源模型中达到 SOTA 水平，尤其擅长 Agentic 工具调用、代码生成和高难推理任务。

在线运行：https://go.hyper.ai/OBlhv

2. HiDream-O1-Image 图像生成系统

HiDream-O1-Image 是一个原生的统一图像生成基础模型，是 HiDream.ai 团队于 2026 推出的。模型基于像素级统一 Transformer（UiT）架构构建。与传统模型不同，它不依赖外部 VAE 或分离的文本编码器，而是在单一共享的 Token 空间中原生编码像素和文本。

在线运行：https://go.hyper.ai/XkyGK

3. X2SAM：统一图像与视频任意分割模型

X2SAM 由中山大学、鹏城实验室和美团团队于 2026 年 4 月发布，是面向图像与视频统一分割场景的多模态大模型。该项目的核心特点在于把文本提示、视觉提示和图像/视频分割统一到一套交互流程中。

在线运行：https://go.hyper.ai/OAndb

4. LocateAnything-3B：快速高质量视觉语言定位模型

LocateAnything-3B 由 NVIDIA 于 2026 年发布，是 Eagle VLM 系列中的 3B 参数视觉语言定位模型，面向图像与视频中的开放目标检测、指代表达定位、 OCR 文本定位、 GUI 元素定位和 pointing 等任务。该模型的核心特点是 Parallel Box Decoding：它将完整边界框坐标作为结构化块并行预测，而不是逐 token 自回归生成坐标，从而在保持几何一致性的同时提升定位吞吐。

在线运行：https://go.hyper.ai/DxUFC

5. Granite 4.1 8B：支持对话、编码、 RAG 及工具调用

Granite 4.1 语言模型是由 IBM 于 2026 年推出的新一代开源基础模型系列，涵盖 3B 、 8B 和 30B 三种规模的密集解码器架构。其中 Granite 4.1 8B 作为该系列中的高效版本，在保持轻量级参数规模的同时，实现了企业级应用所需的卓越性能。该模型原生支持多语言能力、广泛的编码任务、检索增强生成（RAG）、工具使用以及结构化 JSON 输出，为落地场景提供了强大的技术保障。

在线运行：https://go.hyper.ai/Fpzl7