腾讯开源 Hy-MT1.5 翻译模型：440MB 跑出顶级翻译能力；MIT 联合发布 MathNet：涵盖 2.7 万道奥数真题的多模态数学推理基准

1 个月前

Hy-MT1.5-1.8B-1.25bit 是腾讯推出的轻量级机器翻译模型，基于 Hy-MT1.5-1.8B 构建，通过 MT 预训练、监督微调、蒸馏与强化学习等多阶段训练优化而成。模型支持 33 种语言、 5 种方言及少数民族语言，以及 1,056 个翻译方向。在仅有 18 亿参数的情况下，其翻译效果已超过部分更大规模开源模型与主流商业翻译 API 。

目前，HyperAI 超神经官网已上线了「Hy-MT1.5-1.8B-1.25bit：轻量级多语言翻译模型」，快来试试吧~

在线使用：https://go.hyper.ai/PCK8X

欢迎登录官网查看更多内容：

https://hyper.ai

5 月 6 日- 5 月 15 日，hyper.ai 官网更新速览：

* 优质公共数据集：12 个

* 优质教程精选：7 个

* 社区文章解读：3 篇

* 热门百科词条：5 条

* 5 月截稿顶会：4 个

访问官网：hyper.ai

公共数据集精选

1. QCalEval 量子校准图表理解数据集

QCalEval 是由 NVIDIA 于 2026 年发布的一个面向量子计算实验图理解的视觉语言数据集，旨在评估视觉语言模型（VLM）对量子计算校准实验结果进行解释、分类和推理能力，广泛应用于视觉语言模型与科学图像理解研究。该数据集包含 309 张 PNG 格式的二维科学图像，以及 243 个基准测试条目与 236 个少样本基准测试条目，整体覆盖 22 个实验系列并涉及 87 种场景类型。

在线使用：https://go.hyper.ai/Ke7cu

2. Claw-Eval 真实世界评测基准数据集

Claw-Eval 是由北京大学联合香港大学于 2026 年发布的一个面向 AI Agent 真实世界任务评测的端到端透明评测基准数据集，旨在评估自主智能体在真实环境中的任务执行、工具调用、多模态理解及多轮交互能力。该数据集支持英文与中文两种语言，包含 General 、 Multimodal 与 Multi-turn 三个核心任务组，共覆盖通信、金融、办公、生产力工具等 24 个任务类别。

在线使用：https://go.hyper.ai/Tznpa

3. MathNet 多模态数学基准推理数据集

MathNet 是由 MIT 团队联合阿卜杜拉国王科技大学等机构于 2026 年发布的一个大规模多语言、多模态数学推理数据集，旨在评估与提升大模型在奥林匹克级数学推理与结构化检索任务中的能力，广泛应用于用于数学推理评测、 RAG 研究及多模态 AI 训练等方向。

在线使用：https://go.hyper.ai/HLxNw

4. RSRCC 遥感区域变化理解基准数据集

RSRCC 是由 Google Research 于 2026 年发布的一个遥感语义变化理解基准数据集，旨在支持对遥感场景中时间变化的深度理解，通过配对多时相图像证据与自然语言问答，将传统的二值变化检测提升至语义变化描述的维度。该数据集包含 12.6 万个面向遥感变化检测的问答样本，涵盖新建工程、拆除、道路变化、植被变化及住宅开发等场景。

在线使用：https://go.hyper.ai/jtCaK

5. Medical Waste 医疗废弃物检测数据集

Medical Waste 是一个面向医疗废弃物智能识别与目标检测任务构建的高分辨率图像数据集，旨在帮助计算机视觉模型在复杂医疗环境中实现医疗废弃物的自动检测与分类，广泛应用于智慧医疗、公共卫生、自动化垃圾分拣及机器人视觉等研究方向。

在线使用：https://go.hyper.ai/PrUKd

6. GRAPE Leaf Diseases 葡萄叶片病害检测数据集

GRAPE Leaf Diseases 是一个专门面向精准农业目标检测任务构建的葡萄叶片图像数据集，旨在提升计算机视觉模型在真实农业场景中的病害检测、分类与定位能力。该数据集包含 4,195 张葡萄叶片图像，涵盖 4 个类别，包括健康葡萄叶片以及 3 种常见病害：黑腐病、埃斯卡病和叶枯病。

在线使用：https://go.hyper.ai/tJrkm

7. Aquatic Wildlife Atlas 全球水生生物图鉴数据集

Aquatic Wildlife Atlas: Global Species Records 是一个面向水生生物生态研究与生物多样性分析构建的大规模水生动物观测数据集，旨在为研究人员、学生与数据科学家提供高质量的水生生态数据资源。该数据集包含 20 万条水生动物观测记录，覆盖 100 种以上水生物种，涉及全球主要水域生态环境，包括珊瑚礁、热带河流、北极海域以及深达 7,000 米的深海区域。

在线使用：https://go.hyper.ai/calNa

8. Global Earthquake-M4.5 全球 4.5 级以上地震数据集

Global Earthquake Events – M4.5+ 是一个面向地震活动分析与地理空间研究构建的全球地震事件数据集，旨在帮助研究人员分析长期地震活动的频率、分布与震级变化。该数据集包含 230,608 条地震记录，涵盖 1900-2026 年全球震级 4.5 级及以上的地震事件。

在线使用：https://go.hyper.ai/D7j95

9. Synthetic Drug Effectiveness 合成药物有效性数据集

Synthetic Drug Effectiveness 是一个生成的合成药物数据集，旨在支持药物安全性分析与临床风险评估，适用于数据分析、模型构建及实验研究。该数据集包含药物使用与不良反应监测的结构化医疗信息，每条记录以唯一报告编号为索引，涵盖患者年龄与性别等基础信息，以及药物名称、剂量、用药持续时间和合并用药情况等治疗细节。

在线使用：https://go.hyper.ai/1ZaA0

10. Eye Disease Classification Fundus 眼底疾病分类数据集

Eye Disease Classification Fundus 是一个面向眼底图像分类任务构建的医学视觉数据集，旨在提升计算机视觉模型在眼科疾病识别与辅助诊断场景中的分类能力。该数据集共包含 6,086 张图像，包含白内障、糖尿病视网膜病变、青光眼以及正常眼底 4 类眼底图像。

在线使用：https://go.hyper.ai/FFFE7

11. Breast Cancer：Multi-Modal Fusion 乳腺癌多模态融合数据集

Breast Cancer：Multi-Modal Fusion 是一个针对乳腺浸润癌（BRCA）患者构建的、已完成预处理的多模态数据集，旨在为构建多模态融合网络提供即插即用的基础。该数据集严格对齐了 122 名 BRCA 患者的多源数据，所有样本均通过 TCGA Case ID 完成跨模态映射，实现了宏观医学影像（MRI）、微观数字病理学（Histopathology）、分子组学（Multi-Omics）以及临床治疗信息之间的一一对应。

在线使用：https://go.hyper.ai/199WV

12. Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Long-Distance Wildfire & Smoke Detection 是一个面向森林火灾早期预警与环境监测任务构建的计算机视觉数据集，旨在提升模型在远距离森林监控场景中的烟雾与野火检测能力。该数据集采用完全合成（Synthetic）方式生成，模拟森林防火塔、山脊监控摄像头等高视角远距离监控场景，重点关注火灾早期更容易被观测到的野火烟柱检测任务。

在线使用：https://go.hyper.ai/LnuXC

公共教程精选

1. Hy-MT1.5-1.8B-1.25bit：轻量级多语言翻译模型

Hy-MT1.5-1.8B-1.25bit 由 Tencent 于 2026 年 4 月发布，是基于 Hy-MT1.5-1.8B 的 1.25-bit 量化多语言翻译模型。该模型的核心价值在于将较高质量的多语言翻译能力压缩到更轻量的部署形态中。

在线运行：https://go.hyper.ai/PCK8X

2. Uni-Mol：通用 3D 分子表示学习框架

Uni-Mol 是由深势科技（DP Technology）于 2022 年发布的通用 3D 分子预训练框架。 Uni-Mol 通过大规模 3D 分子结构预训练扩展分子表示能力，可用于药物设计、分子性质预测、蛋白质-配体相互作用建模等任务。

在线运行：https://go.hyper.ai/RukIx

3. 一键部署 Mistral-Medium-3.5-128B

Mistral Medium 3.5 是 Mistral AI 于 2025 年发布的旗舰级融合模型，拥有 1280 亿（128B）参数与 256k 上下文窗口，在单组权重中统一了指令遵循、推理与编程能力。该模型替代了此前的 Mistral Medium 3.1 和 Magistral，并在编程智能体 Vibe 中替代了 Devstral 2 。

在线运行：https://go.hyper.ai/PXiHc

4. OmniVoice：支持 600+ 语言的高质量 TTS

OmniVoice 是小米 AI Lab Next-gen Kaldi 团队推出的多语言文本转语音（Text-to-Speech, TTS）模型，支持超过 600 种语言的高质量语音合成。该项目基于迭代式非掩码解码（Iterative Unmasked Decoding）架构，实现了语音克隆（Voice Clone）、语音设计（Voice Design）和自动语音（Auto Voice）三大核心功能。

在线运行：https://go.hyper.ai/7F7IR

5. MiniCPM-V-4.6：端侧高效多模态视觉语言模型

MiniCPM-V-4.6 由 OpenBMB 团队和清华大学自然语言处理实验室于 2026 年 5 月发布，面向图像理解、视频理解、视觉问答、 OCR 与多轮多模态对话场景的端侧高效多模态视觉语言模型。该模型的核心价值在于用较小模型体积覆盖常见多模态理解任务，更适合在资源受限环境中进行图像问答、短视频摘要、界面截图理解、文档图像 OCR 与多轮多模态对话验证。

在线运行：https://go.hyper.ai/azdHU

6. LingBot-Map：用于流式 3D 重建的几何上下文变换器

LingBot-Map 是 Robbyant Team 在 2026 年 4 月发布的流式 3D 重建项目，该项目面向图像序列或视频帧输入，能够以 feed-forward 的方式进行在线 3D 场景重建，并通过浏览器中的 3D Viewer 查看点云、相机轨迹和逐帧结果。

在线运行：https://go.hyper.ai/BR4me

7. HY-Embodied-0.5：面向现实世界智能体的具身基础模型

HY-Embodied-0.5 是由腾讯混元团队联合腾讯 Robotics X 实验室于 2026 年 4 月联合开源的专为具身智能打造的基础模型。该系列模型并非通用基座的简单微调，而是从架构到训练范式的彻底重构。团队同步推出两款主力模型：MoT-2B（总参 4B，激活 2B）主打端侧实时响应，MoE-32B（总参 407B，激活 32B）追求极致推理性能。

在线运行：https://go.hyper.ai/u8lJk

社区文章解读

1. 平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

来自 MIT 和 MIT-IBM 沃森人工智能实验室的研究人员构建了一个面向 AI 工作负载的快速 GPU 功耗估计框架 EnergAIzer，可在无需昂贵仿真或性能分析的情况下，直接为功耗模型提供硬件利用率信息。该新框架平均仅需 1.8 秒即可完成端到端功耗估计，在 NVIDIA Ampere GPU 上，EnergAIzer 实现了约 8% 的功耗误差，与依赖复杂周期级仿真或硬件性能分析的传统模型具有竞争力。

查看完整报道：https://go.hyper.ai/1PeMV

2. Token 使用量降低 30%，以「阿凡达」为灵感的异构智能体框架 Eywa，高效结合语言模型与领域专用基础模型

来自伊利诺伊大学香槟分校（UIUC）的研究团队提出了一个用于连接语言智能体与领域专用基础模型的异构智能体框架 Eywa 。研究人员通过将领域专用基础模型与语言模型结合，构建出一种新的 EywaAgent，这种设计使语言智能体能够引导基础模型在其专业任务上的推理、规划与决策过程。

查看完整报道：https://go.hyper.ai/CzRL4

3. 百所高校展开全球最大规模多队列蛋白质基因组学研究，基于近 8 万受试者数据解锁致病基因与老药新用

来自伦敦玛丽女王大学、剑桥大学等上百家院校和研究机构的团队公布了一项迄今为止全球规模最大的多队列蛋白质基因组学研究，依托涵盖 38 个独立研究队列、共计 78,664 名受试者的大规模蛋白质基因组荟萃分析，系统鉴定出 24,738 个蛋白质数量性状位点并关联 1,116 种循环蛋白，全面揭示了蛋白水平存在广泛的邻近及远距离遗传调控特征。

查看完整报道：https://go.hyper.ai/lGD68