음성 처리

음성 기술은 컴퓨터 시스템이 인간의 음성을 처리하여 음성 인식, 합성, 및 이해를 달성하는 능력을 말합니다. 이 기술의 목표는 사용자 경험을 향상시키며 효율적으로 상호작용할 수 있는 지능형 시스템을 구축하는 것입니다. 음성 기술은 가상 비서, 고객 서비스 시스템, 음성 번역 등 다양한 분야에서 널리 적용되어, 인간과 컴퓨터 간의 상호작용을 더욱 자연스럽고 편리하게 만드는 데 크게 기여하고 있습니다.

음성 인식

135개 논문 | 148개 벤치마크

음성 분리

46개 논문 | 19개 벤치마크

화자 인식

10개 논문 | 15개 벤치마크

음성 감정 인식

31개 논문 | 15개 벤치마크

음성 향상

63개 논문 | 14개 벤치마크

대화 생성

12개 논문 | 13개 벤치마크

언어 식별

6개 논문 | 12개 벤치마크

스피커 인증

12개 논문 | 12개 벤치마크

키워드 인식

53개 논문 | 10개 벤치마크

자동 음성 인식

11개 논문 | 8개 벤치마크

다중모달 감정 인식

12개 논문 | 7개 벤치마크

대역폭 확장

2개 논문 | 6개 벤치마크

텍스트-투-스피치 합성

14개 논문 | 6개 벤치마크

자동 음소 인식

1개 논문 | 6개 벤치마크

음성 역반사 제거

6개 논문 | 5개 벤치마크

언어 이해

20개 논문 | 5개 벤치마크

음성 합성

19개 논문 | 5개 벤치마크

스토리 생성

2개 논문 | 5개 벤치마크

자동 가사 전사

2개 논문 | 5개 벤치마크

오디오-비주얼 음성 인식

19개 논문 | 4개 벤치마크

화자 식별

9개 논문 | 4개 벤치마크

강조된 음성 인식

2개 논문 | 4개 벤치마크

음성 변환

3개 논문 | 3개 벤치마크

음성-음성 번역

5개 논문 | 3개 벤치마크

원격 음성 인식

4개 논문 | 2개 벤치마크

시각적 음성 인식

2개 논문 | 2개 벤치마크

노이즈 연설 인식

4개 논문 | 2개 벤치마크

음성 잡음 제거

1개 논문 | 2개 벤치마크

아랍어 텍스트 자모음화

7개 논문 | 2개 벤치마크

음성 합성

2개 논문 | 2개 벤치마크

음성 추출

1개 논문 | 1개 벤치마크

문화적 음성 폭발 강도 예측

2개 논문 | 1개 벤치마크

음성 단위 발견

1개 논문 | 1개 벤치마크

음성 폭발형 유형 예측

1개 논문 | 1개 벤치마크

화자 인식

2개 논문 | 1개 벤치마크

언어_인식_시스템

1개 논문 | 1개 벤치마크

오디오 딥페이크 감지

8개 논문 | 1개 벤치마크

음성 명령 인식

3개 논문 | 1개 벤치마크

폰 레벨 발음 평가

6개 논문 | 1개 벤치마크

단어 수준 발음 평가

3개 논문 | 1개 벤치마크

A-VB 고급

1개 논문 | 1개 벤치마크

발화 단위 발음 평가

3개 논문 | 1개 벤치마크

음성 쿼리 인식

1개 논문 | 1개 벤치마크

A-VB 문화

1개 논문 | 1개 벤치마크

A-VB 두 개

1개 논문 | 1개 벤치마크

음성 합성 - 아삼어

1개 논문 | 1개 벤치마크

음성 합성 - 벵갈어

1개 논문 | 1개 벤치마크

음성 합성 - 보도

1개 논문 | 1개 벤치마크

음성 합성

1개 논문 | 1개 벤치마크

음성 합성

1개 논문 | 1개 벤치마크

말라야람 음성 합성

1개 논문 | 1개 벤치마크

음성 합성 - 마니푸리

1개 논문 | 1개 벤치마크

음성 합성

1개 논문 | 1개 벤치마크

음성 합성

1개 논문 | 1개 벤치마크

음성 합성 - 타밀어

1개 논문 | 1개 벤치마크

음성 합성

1개 논문 | 1개 벤치마크
음성 처리 - SOTA | HyperAI초신경