HyperAIHyperAI

Command Palette

Search for a command to run...

Granary 欧洲语音识别与翻译数据集

Date

4 个月前

Size

50.49 GB

Organization

NVIDIA(英伟达)

Paper URL

2505.13404v2

Granary 是由英伟达多地研究团队于 2025 年发布的一个大规模多语种语音数据集,相关论文成果为「Granary: Speech Recognition and Translation Dataset in 25 European Languages」,旨在为多语种 ASR/AST 模型提供高质量训练与评测素材。

该数据集包含约 100 万小时的高质量伪标记 ASR 语音数据,覆盖 25 种欧洲语言(含 23 种欧盟语言、以及乌克兰语和俄语)。数据来自公开语音语料并经统一的伪标注与质量过滤流程处理。

语种包括:

保加利亚语、捷克语、丹麦语、德语、希腊语、英语、西班牙语、爱沙尼亚语、芬兰语、法语、克罗地亚语、匈牙利语、意大利语、立陶宛语、拉脱维亚语、马耳他语、荷兰语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语、乌克兰语和俄语。

Granary.torrent
Seeding 1Downloading 0Completed 50Total Downloads 73
  • Granary/
    • README.md
      1.66 KB
    • README.txt
      3.31 KB
      • data/
        • Granary.zip
          50.49 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供