HyperAI超神经

HyperAI

Speaker-Specific Lip to Speech Synthesis任务旨在通过训练特定个体或极少数个体的唇部运动数据，准确推断其语音风格和内容。该技术结合了计算机视觉与语音合成领域的最新进展，能够实现高度个性化的唇动到语音转换，具有重要的应用价值，如提升视频通话质量、辅助听力障碍者沟通及增强虚拟现实体验。

GRID corpus (mixed-speech)

TCD-TIMIT corpus (mixed-speech)