2 个月前

Vibravox:使用体传导音频传感器采集的法语语音数据集

Julien Hauret, Malo Olivier, Thomas Joubaud, Christophe Langrenne, Sarah Poirée, Véronique Zimpfer, Éric Bavu
Vibravox:使用体传导音频传感器采集的法语语音数据集
摘要

Vibravox 是一个符合《通用数据保护条例》(GDPR)的数据集,包含使用五种不同体传导音频传感器录制的音频记录:两个耳内麦克风、两个骨传导振动拾音器和一个喉头电话。该数据集还包括一个空气传播麦克风作为参考的音频数据。Vibravox 语料库包含由188名参与者在高阶Ambisonics 3D空间化器施加的不同声学条件下录制的38小时语音样本和生理声音。语料库中还包含了关于录音条件和语言转录的注释。我们对多种与语音相关的任务进行了一系列实验,包括语音识别、语音增强和说话人验证。这些实验使用了最先进的模型来评估和比较不同音频传感器捕获信号的性能,旨在更好地了解这些传感器各自的特性。