日期

9 个月前

大小

169.51 MB

数据集组织

论文 URL

2506.21875

许可证

CC BY 4.0

标签

音频生成

WildSpeech-Bench 是由腾讯于 2025 年发布的首个用于评估 SpeechLLM 语音转语音能力的基准，相关论文成果为「WildSpeech-Bench: Benchmarking End-to-End SpeechLLMs in the Wild」，旨在衡量模型在真实语音交互场景中完整语音输入到语音输出（Speech-to-Speech, S2S）的理解与生成能力。该数据集共包含 1,100 条查询（query），覆盖信息查询、解决方案请求、观点交流、文本创作、副语言特征表达五大主要类别，每个类别对应一种常见的用户意图。其中 1,000 条来自一般语音交互场景（包括信息查询、解决方案请求、观点交流和文本创作），另有 100 条具有副语言特征（Paralinguistic-Featured），例如停顿、语气、口吃、近音词识别等。每条查询均配有多样化的语音输出样例，涵盖丰富的说话者属性（性别、年龄、音色变体）、声学条件及噪声环境设置，以更真实地模拟自然语音交互中的多样性与挑战性。

Citation

@misc{zhang2025wildspeechbenchbenchmarkingendtoendspeechllms, title={WildSpeech-Bench: Benchmarking End-to-End SpeechLLMs in the Wild}, author={Linhao Zhang and Jian Zhang and Bokai Lei and Chuhan Wu and Aiwei Liu and Wei Jia and Xiao Zhou}, year={2025}, eprint={2506.21875}, archivePrefix={arXiv}, primaryClass={cs.CL}, }

WildSpeech-Bench.torrent

做种 1正在下载 0已完成 1总下载量 118

WildSpeech-Bench/
- README.md
  1.83 KB
- README.txt
  3.66 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

9 个月前

大小

169.51 MB

数据集组织

论文 URL

2506.21875

许可证

CC BY 4.0

标签

音频生成

Citation

WildSpeech-Bench.torrent

做种 1正在下载 0已完成 1总下载量 118

WildSpeech-Bench/
- README.md
  1.83 KB
- README.txt
  3.66 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

MAKIEVAL 多语言文化知识评估数据集

1 天前

Verbatim Spans 查询条件证据提取数据集

1 天前

RHELM 长程记忆评估数据集

21 小时前

SAM 3D Artist Objects 3D 物体重建数据集

1 天前

FigureBench 科学插图生成基准数据集

3 小时前

TACK 靶向嵌合体知识库数据集

15 天前

chi-bench 医疗智能体基准评测数据集

6 天前

ViMU 视频隐喻理解数据集

19 天前

MemLens 多模态长上下文基准数据集

19 天前

Eye Disease Classification Fundus 眼底疾病分类数据集

1 个月前

QCalEval 量子校准图表理解数据集

2 个月前

MDPBench 多语言文档解析基准数据集

1 天前

World Model Bench 世界模型基准数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

WildSpeech-Bench 语音理解生成基准数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

WildSpeech-Bench 语音理解生成基准数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

QCalEval 量子校准图表理解数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

WildSpeech-Bench 语音理解生成基准数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

QCalEval 量子校准图表理解数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

QCalEval 量子校准图表理解数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

TACK 靶向嵌合体知识库数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

QCalEval 量子校准图表理解数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集