极致轻量，画质不减！ERNIE-Image-Turbo：告别漫长等待，速度快到飞起；引入感知与认知双维指标：阿里多模态统一解析评估数据集 OmniParsingBench 上线

3 个月前

ERNIE-Image-Turbo 是由百度开源的一款高效文生图模型。它基于单流扩散变换器（DiT）架构，并经过 DMD 与 RL 技术的深度优化，仅需 8 个推理步骤即可快速生成高保真、高美观度的图像。凭借出色的轻量化设计，大幅降低了应用和研究的硬件门槛。

在保持极速生成的同时，该模型展现了强大的可控性与多功能性。它不仅能精准执行包含多对象、复杂关系的指令，还极大地增强了长文本密集渲染与结构化布局的能力，是海报设计、多格漫画及信息图表等排版任务的不二之选。此外，它全面支持写实摄影、设计排版及柔和电影感等多种美学风格，是一款兼顾了视觉质量与工业级创作效率的理想工具。

目前，HyperAI 超神经官网已上线了「ERNIE-Image-Turbo 文生图模型」，快来试试吧~

在线使用：https://go.hyper.ai/hmKUg

欢迎登录官网查看更多内容：

https://hyper.ai

4 月 18 日-4 月 24 日，hyper.ai 官网更新速览：

* 优质公共数据集：9 个

* 优质教程精选：5 个

* 社区文章解读：2 篇

* 热门百科词条：5 条

* 4 月截稿顶会：1 个

访问官网：hyper.ai

公共数据集精选

1. OmniParsingBench 多模态解析能力评估数据集

OmniParsingBench 是由阿里巴巴于 2026 年发布的一个面向多模态大模型（MLLM）统一解析能力评估的基准数据集。该数据集包含约 5,294 条样本，覆盖 6 大模态领域（自然图像、图形、文档、音频、自然视频与文本密集视频），并引入感知（Perc.）、认知（Cog.）和总体（Ovr.）3 层评测指标。每条数据包含图像或音视频输入及对应的结构化解析任务。

在线使用：https://go.hyper.ai/AqyDg

2.BRIGHT 灾害建筑评估数据集

BRIGHT 是首个开放获取、全球分布、事件类型多样的多模态全球灾害场景基准数据集，其融合光学影像与 SAR（合成孔径雷达）数据。该数据集覆盖 14 个地区、 7 类灾害（5 类自然灾害 + 2 类人为灾害），包含约 4,200 对配对影像，涉及 38 万以上建筑实例，空间分辨率约 0.3–1 米。数据由灾前影像、灾后影像及目标标注构成。

在线使用：https://go.hyper.ai/RifVg

3. Flower 孟加拉花卉图像数据集

Flower 孟加拉花卉图像数据集是一个面向计算机视觉图像分类任务的数据集。该数据集包含孟加拉地区真实拍摄的多类花卉图像，均为非合成的实景图像，图像在自然光照条件下采集，呈现出丰富的色彩变化，涵盖当地多样的花卉品种与外观特征，按类别标注。

在线使用：https://go.hyper.ai/wirun

4. MIA 多步推理与决策轨迹数据集

MIA 多步推理与决策轨迹数据集是由华东师范大学、上海创新研究院和哈尔滨工业大学于 2026 年 4 月联合发布的一个用于训练和评估具备长期记忆与任务执行能力的智能体的数据集。该数据集包含约 2.1 万条推理轨迹数据，涵盖问题、规划、搜索与执行全过程，适用于 Agent 推理与强化学习研究。

在线使用：https://go.hyper.ai/XITit

5. PanScale 遥感全色锐化数据集

PanScale 是由中国科学院联合中国科学技术大学、香港科技大学于 2026 年发布的一个面向大模型尺度推理与能力评估的基准数据集。该数据集包含包含 7,559 对多光谱（MS）与全色（PAN）图像，采用 8 位 TIFF 格式。数据覆盖 jilin 、 landsat 、 skysat 等多个子集，并扩展出 fjilin 、 flandsat 、 fskysat 等跨尺度版本，支持从同尺度到多尺度（最高 4.0 倍）场景的系统评估。

在线使用：https://go.hyper.ai/mz2gh

6. Emotion-probes 情绪探测数据集

Emotion-probes 是一个合成文本数据集，面向情绪理解与模型可解释性研究，旨在提取模型中的情绪向量与情绪掩饰能力，广泛用于情绪分类、模型对齐、安全研究及大模型内部机制分析等场景，该数据集包含约 447,000 条样本。每条数据包含真实情绪、表现情绪、文本内容及角色信息等字段

在线使用：https://go.hyper.ai/jw5FA

7. OpenMementos 上下文记忆压缩数据集

OpenMementos 是由 Microsoft 于 2026 年发布的一个上下文记忆压缩数据集，面向大模型长链推理与上下文管理能力建模。该数据集旨在训练模型进行上下文压缩与持续推理，从而支持在有限上下文窗口下完成复杂多步推理任务，广泛适用于长链推理建模、记忆增强模型训练及高效生成等研究场景。

在线使用：https://go.hyper.ai/RwCkt

8. ParseBench 文档解析能力评测数据集

ParseBench 文档解析能力评测数据集由 LlamaIndex 团队于 2024–2025 年发布。该数据集包含约 2,000 个经人工验证和标注的页面和五个维度的 169,011 条测试规则。这些页面取自公开的企业文档，涵盖保险、金融、政府和其他领域，涵盖 PDF 、扫描图像及包含表格与版面结构等多类型页面，并提供标准化解析结果与人工标注对齐，用于评测模型在结构理解与信息抽取方面的表现。

在线使用：https://go.hyper.ai/FfFR6

9. SOHL-multidish-yolo 多菜印度食品检测数据集

SOHL Multi-Dish YOLO 是一个面向计算机视觉中多目标检测任务的食品识别数据集，基于 YOLOv8 标注规范构建，专注于复杂场景下多菜品检测问题。该数据集包含 377 张带标注图像，对应 377 条标注数据，覆盖 16 类食品类别，每张图像包含 2–6 个食物目标，具有重叠、多尺度与复杂布局等特点。

在线使用：https://go.hyper.ai/u5Lng

公共教程精选

1. ERNIE-Image-Turbo 文生图模型

ERNIE-Image-Turbo 是百度 ERNIE-Image 团队于 2026 年 4 月发布的开源文本转图像生成模型。 ERNIE-Image-Turbo 具备复杂指令跟踪、文本渲染、海报布局生成、结构化图像生成以及广泛的风格覆盖等功能，使其适用于海报设计、插画生成、界面概念草图绘制等创意内容工作流程。

在线运行：https://go.hyper.ai/hmKUg

2. 一键部署 Qwen3.6-27B

Qwen3.6-27B 是通义千问团队开源的一个拥有 270 亿参数的稠密多模态模型。该模型依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B 。作为稠密架构，它无需 MoE 路由即可部署，是开发者在实用、可广泛部署规模上获取顶尖编程能力的理想选择。

在线运行：https://go.hyper.ai/GU9S2

3. SAM3.1：视频多目标跟踪与分割

SAM3.1（Segment Anything Model 3.1）是一个面向视频的开放词汇目标跟踪与分割系统。该模型通过引入对象复用（Object Multiplexing）技术，实现了高效的多目标视频跟踪。

在线运行：https://go.hyper.ai/3e5qL

4. Qwen3.6-35B-A3B 智能体编程利器

Qwen 团队于 2026 年 4 月发布了多模态混合专家（MoE）模型 Qwen3.6-35B-A3B 。该模型总共有 350 亿个参数，但每次推理仅激活 30 亿个参数，从而在保持高性能的同时显著降低了推理成本。

在线运行：https://go.hyper.ai/Gc7bp

5. 从零开始构建神经网络：NumPy 教程

用户仅依赖 NumPy 库，从零开始纯手工搭建一个简单的神经网络框架，全面覆盖了从神经元、权重、前向传播到隐藏层、激活与损失函数等核心概念。本教程还能帮助用户从原理层面理解深度学习模型的构建方式，而不仅仅停留在调用框架接口的层面。

在线运行：https://go.hyper.ai/OmyS0

💡我们还建立了 Stable Diffusion 教程交流群，欢迎小伙伴们扫码备注【SD 教程】，入群探讨各类技术问题、分享应用效果~

社区文章解读

1. ICLR 2026 丨单任务可训练参数减少 125 倍！新方法 Task Tokens 助力具身智能提升复杂任务能力

来自以色列理工学院的研究团队提出了一种名为 Task Tokens 的方法，该方法能够在保持 BFM 灵活性的同时，有效地将其适配到特定任务。与标准基线方法相比，新方法可以将每个任务的可训练参数减少高达 125 倍，并且收敛速度提高高达 6 倍。同时，研究人员也在多种任务（包括分布外场景）中验证了 Task Tokens 的有效性，并展示了其与其他提示方式的兼容性。

查看完整报道：https://go.hyper.ai/vs0C6

2. 推理速度提升 3 倍，多伦多大学等提出 dnaHNet，基因组学习计算成本降低近 4 倍

多伦多大学、加拿大 Vector 人工智能研究院及美国 Arc Institute 等机构联合提出的 dnaHNet 模型，为突破计算可行性与生物学保真度之间取得更优平衡提供了新的思路。

查看完整报道：https://go.hyper.ai/dRnYT