@misc{lin2025vera, title={Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap}, author={Lin, Yueqian and Hu, Zhengmian and Wang, Qinsi and Liu, Yudong and Zhang, Hengfan and Subramanian, Jayakumar and Vlassis, Nikos and Li, Hai Helen and Chen, Yiran}, year={2025}, eprint={2509.26542}, archivePrefix={arXiv}, primaryClass={eess.AS}, url={https://arxiv.org/abs/2509.26542} }

日付

8ヶ月前

サイズ

2.37 GB

データセット構成

公開URL

github.com

論文URL

2509.26542

ライセンス

CC BY 4.0

タグ

音声および音声処理

インテリジェントな質問応答

Reasoning

VERAは、デューク大学がAdobeと共同で2025年に公開した大規模なマルチタスク音声データセットで、ネイティブ音声の推論能力を評価するために設計されています。関連する研究論文のタイトルは「音声による推論能力の評価：モダリティによるパフォーマンスギャップの診断目標は、音声ネイティブ条件下での大規模モデルの推論能力を評価することです。このデータセットには、タスク特性に基づいて 5 つのトラックに分割された 2,931 個のネイティブ音声推論サンプル (エピソード) が含まれています。

数学（115件）：AIME 2025の競技数学問題
Web (1,107 エントリ): BrowseComp からの Web 閲覧および情報検索タスク
科学（161 項目）：GPQA Diamond に基づいた大学院レベルの科学の質問。
長文読解（548項目）：MRCRの複数ラウンドの長文読解課題
事実（1,000 エントリ）：SimpleQA に基づいた事実に関する質問と回答。すべてのサンプルはネイティブ音声形式で提示され、Boson Higgs Audio 2によって合成された音声により、一貫性があり明瞭で高品質な音声パフォーマンスが保証されています。データセット内の各サンプルのaudio_fileフィールドは、対応するオーディオパスを指しています。

データ構造:

データはJSON形式で整理されており、各エピソードには完全な音声推論サンプルが含まれています。コアフィールドは次のとおりです。

id: 一意の識別子
トラック: 所属するトラック (mathematical_reasoning / web / science / long_context / factual)
ターン: 次のような対話ラウンドの数:

役割（ユーザーに固定）
text_content (Base64 暗号化テキスト)
audio_file（対応するオーディオパス）
prefix_text と postfix_text (空でも可)

context_documents: 補足的なコンテキスト資料（ある場合）
割り込み: 割り込みイベントのログ記録
metadata.expected_answer: 暗号化された参照回答
canary: このサンプルの一意の復号化キー。

引用

@misc{lin2025vera,
title={Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap},
author={Lin, Yueqian and Hu, Zhengmian and Wang, Qinsi and Liu, Yudong and Zhang, Hengfan and Subramanian, Jayakumar and Vlassis, Nikos and Li, Hai Helen and Chen, Yiran},
year={2025},
eprint={2509.26542},
archivePrefix={arXiv},
primaryClass={eess.AS},
url={https://arxiv.org/abs/2509.26542}
}

VERA.torrent

シーディング 2ダウンロード中 0完了 4総ダウンロード数 92

VERA/
- README.md
  2.37 KB
- README.txt
  4.74 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

8ヶ月前

サイズ

2.37 GB

データセット構成

公開URL

github.com

論文URL

2509.26542

ライセンス

CC BY 4.0

タグ

音声および音声処理

インテリジェントな質問応答

Reasoning

数学（115件）：AIME 2025の競技数学問題
Web (1,107 エントリ): BrowseComp からの Web 閲覧および情報検索タスク
科学（161 項目）：GPQA Diamond に基づいた大学院レベルの科学の質問。
長文読解（548項目）：MRCRの複数ラウンドの長文読解課題
事実（1,000 エントリ）：SimpleQA に基づいた事実に関する質問と回答。すべてのサンプルはネイティブ音声形式で提示され、Boson Higgs Audio 2によって合成された音声により、一貫性があり明瞭で高品質な音声パフォーマンスが保証されています。データセット内の各サンプルのaudio_fileフィールドは、対応するオーディオパスを指しています。

データ構造:

データはJSON形式で整理されており、各エピソードには完全な音声推論サンプルが含まれています。コアフィールドは次のとおりです。

id: 一意の識別子
トラック: 所属するトラック (mathematical_reasoning / web / science / long_context / factual)
ターン: 次のような対話ラウンドの数:

役割（ユーザーに固定）
text_content (Base64 暗号化テキスト)
audio_file（対応するオーディオパス）
prefix_text と postfix_text (空でも可)

context_documents: 補足的なコンテキスト資料（ある場合）
割り込み: 割り込みイベントのログ記録
metadata.expected_answer: 暗号化された参照回答
canary: このサンプルの一意の復号化キー。

引用

@misc{lin2025vera,
title={Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap},
author={Lin, Yueqian and Hu, Zhengmian and Wang, Qinsi and Liu, Yudong and Zhang, Hengfan and Subramanian, Jayakumar and Vlassis, Nikos and Li, Hai Helen and Chen, Yiran},
year={2025},
eprint={2509.26542},
archivePrefix={arXiv},
primaryClass={eess.AS},
url={https://arxiv.org/abs/2509.26542}
}

VERA.torrent

シーディング 2ダウンロード中 0完了 4総ダウンロード数 92

VERA/
- README.md
  2.37 KB
- README.txt
  4.74 KB

MAKIEVAL 多言語文化知識評価データセット

35分前

逐語的スパンクエリ条件証拠抽出データセット

7時間後

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

7日前

ChartNetチャートの理解：マルチモーダルデータセット

25日前

TACKターゲットキメラ知識ベースデータセット

22日前

SMOL多言語翻訳並列データセット

1ヶ月前

VisCoR-55K ビジュアル推論データセット

1ヶ月前

MathNetマルチモーダル数学ベンチマーク推論データセット

1ヶ月前

Claw-Eval実世界ベンチマークデータセット

1ヶ月前

乳がん：マルチモーダル融合データセット

2ヶ月前

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

8日前

OpenMementos コンテキストメモリ圧縮データセット

2ヶ月前

BRIGHT災害建物評価データセット

8日前

OmniParsingBench マルチモーダル構文解析機能評価データセット

8日前

シンプルな音声質問データセット

2ヶ月前

GPT-5.4ステップバイステップ推論データセット

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

VERA音声推論評価データセット

データ構造:

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

VERA音声推論評価データセット

データ構造:

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

SMOL多言語翻訳並列データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

乳がん：マルチモーダル融合データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

OpenMementos コンテキストメモリ圧縮データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

シンプルな音声質問データセット

GPT-5.4ステップバイステップ推論データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

VERA音声推論評価データセット

データ構造:

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

SMOL多言語翻訳並列データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

乳がん：マルチモーダル融合データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

OpenMementos コンテキストメモリ圧縮データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

シンプルな音声質問データセット

GPT-5.4ステップバイステップ推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

SMOL多言語翻訳並列データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

乳がん：マルチモーダル融合データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

OpenMementos コンテキストメモリ圧縮データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

シンプルな音声質問データセット

GPT-5.4ステップバイステップ推論データセット

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

SMOL多言語翻訳並列データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

乳がん：マルチモーダル融合データセット