HyperAI초신경

Speech

음성 기술은 컴퓨터 시스템이 인간의 음성을 처리하여 음성 인식, 합성, 및 이해를 달성하는 능력을 말합니다. 이 기술의 목표는 사용자 경험을 향상시키며 효율적으로 상호작용할 수 있는 지능형 시스템을 구축하는 것입니다. 음성 기술은 가상 비서, 고객 서비스 시스템, 음성 번역 등 다양한 분야에서 널리 적용되어, 인간과 컴퓨터 간의 상호작용을 더욱 자연스럽고 편리하게 만드는 데 크게 기여하고 있습니다.

Speech Dereverberation

6개 논문 | 5개 벤치마크

Spoken language identification

6개 논문 | 12개 벤치마크

Speech Separation

46개 논문 | 19개 벤치마크

Speech Extraction

1개 논문 | 1개 벤치마크

Bandwidth Extension

2개 논문 | 6개 벤치마크

Spoken Language Understanding

20개 논문 | 5개 벤치마크

Audio-Visual Speech Recognition

19개 논문 | 4개 벤치마크

Voice Conversion

3개 논문 | 3개 벤치마크

Cultural Vocal Bursts Intensity Prediction

2개 논문 | 1개 벤치마크

Dialogue Generation

12개 논문 | 13개 벤치마크

Speech Enhancement

63개 논문 | 14개 벤치마크

Keyword Spotting

53개 논문 | 10개 벤치마크

Speaker Identification

9개 논문 | 4개 벤치마크

Speech Synthesis

19개 논문 | 5개 벤치마크

Distant Speech Recognition

4개 논문 | 2개 벤치마크

Acoustic Unit Discovery

1개 논문 | 1개 벤치마크

Vocal Bursts Type Prediction

1개 논문 | 1개 벤치마크

Speech Recognition

135개 논문 | 148개 벤치마크

Speaker Verification

12개 논문 | 12개 벤치마크

Speaker Recognition

2개 논문 | 1개 벤치마크

Accented Speech Recognition

2개 논문 | 4개 벤치마크

Text-To-Speech Synthesis

14개 논문 | 6개 벤치마크

Story Generation

2개 논문 | 5개 벤치마크

Visual Speech Recognition

2개 논문 | 2개 벤치마크

Multimodal Emotion Recognition

12개 논문 | 7개 벤치마크

Lip to Speech Synthesis

1개 논문 | 1개 벤치마크

Noisy Speech Recognition

4개 논문 | 2개 벤치마크

Speech Denoising

1개 논문 | 2개 벤치마크

Arabic Text Diacritization

7개 논문 | 2개 벤치마크

Speaker Diarization

10개 논문 | 15개 벤치마크

Automatic Lyrics Transcription

2개 논문 | 5개 벤치마크

Speech-to-Speech Translation

5개 논문 | 3개 벤치마크

Audio Deepfake Detection

8개 논문 | 1개 벤치마크

Spoken Command Recognition

3개 논문 | 1개 벤치마크

Phone-level pronunciation scoring

6개 논문 | 1개 벤치마크

Automatic Phoneme Recognition

1개 논문 | 6개 벤치마크

Automatic Speech Recognition (ASR)

11개 논문 | 8개 벤치마크

Speech Emotion Recognition

31개 논문 | 15개 벤치마크

Word-level pronunciation scoring

3개 논문 | 1개 벤치마크

A-VB High

1개 논문 | 1개 벤치마크

Utterance-level pronounciation scoring

3개 논문 | 1개 벤치마크

Voice Query Recognition

1개 논문 | 1개 벤치마크

A-VB Culture

1개 논문 | 1개 벤치마크

A-VB Two

1개 논문 | 1개 벤치마크

Speech Synthesis - Gujarati

2개 논문 | 2개 벤치마크

Speech Synthesis - Assamese

1개 논문 | 1개 벤치마크

Speech Synthesis - Bengali

1개 논문 | 1개 벤치마크

Speech Synthesis - Bodo

1개 논문 | 1개 벤치마크

Speech Synthesis - Hindi

1개 논문 | 1개 벤치마크

Speech Synthesis - Kannada

1개 논문 | 1개 벤치마크

Speech Synthesis - Malayalam

1개 논문 | 1개 벤치마크

Speech Synthesis - Manipuri

1개 논문 | 1개 벤치마크

Speech Synthesis - Marathi

1개 논문 | 1개 벤치마크

Speech Synthesis - Rajasthani

1개 논문 | 1개 벤치마크

Speech Synthesis - Tamil

1개 논문 | 1개 벤치마크

Speech Synthesis - Telugu

1개 논문 | 1개 벤치마크