HyperAIHyperAI

Command Palette

Search for a command to run...

Console

WildSpeech-Bench音声理解生成ベンチマークデータセット

Date

2ヶ月前

Size

169.51 MB

Organization

テンセントAIラボ
テンセント

Paper URL

2506.21875

License

CC BY 4.0

WildSpeech-Benchは、2025年にテンセントがリリースしたSpeechLLMの音声合成機能を評価する最初のベンチマークです。関連する論文の結果は次のとおりです。WildSpeech-Bench: エンドツーエンドの音声LLMのベンチマーク「」は、実際の音声インタラクションのシナリオで、音声入力から音声出力(Speech-to-Speech、S2S)までの完全な音声理解と生成を行うモデルの能力を測定することを目的としています。

このデータセットには、情報クエリ、ソリューション要求、意見交換、テキスト作成、パラ言語的表現という5つの主要カテゴリにわたる1,100件のクエリが含まれています。各カテゴリは、一般的なユーザーインテントに対応しています。これらのクエリのうち1,000件は、一般的な音声インタラクションシナリオ(情報クエリ、ソリューション要求、意見交換、テキスト作成を含む)からのものであり、残りの100件は、休止、イントネーション、吃音、近似音声単語認識などのパラ言語的特徴を特徴としています。各クエリには、多様な話者属性(性別、年齢、声質)、音響条件、ノイズ環境設定を網羅した多様な音声出力例が付属しており、自然な音声インタラクションの多様性と課題をよりリアルにシミュレートしています。

データセット構築プロセス

WildSpeech-Bench.torrent
Seeding 2Downloading 0Completed 0Total Downloads 20
  • WildSpeech-Bench/
    • README.md
      1.83 KB
    • README.txt
      3.66 KB
      • data/
        • WildSpeech-Bench.zip
          169.51 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています