HyperAI超神経

HyperAI

スピーカー固有の唇から音声合成のタスクは、特定の個人や非常に少数のグループの唇の動きデータを学習することで、その人の話し方や内容を正確に推測することを目指しています。この技術は、最新のコンピュータビジョンと音声合成の進歩を取り入れ、非常にパーソナライズされた唇から音声への変換を可能にします。ビデオ通話の品質向上、聴覚障害者のコミュニケーション支援、仮想現実体験の向上など、多くの応用価値があります。

GRID corpus (mixed-speech)

TCD-TIMIT corpus (mixed-speech)