17일 전

향상된 스피커 인식 다자간 다턴 다이얼로그 이해

Xinbei Ma, Zhuosheng Zhang, Hai Zhao
향상된 스피커 인식 다자간 다턴 다이얼로그 이해
초록

다자간 다회화 이해는 다수의 발화자로부터 발생하는 복잡한 상황과 발화자 인식 발화 간의 교차하는 대화 관계를 다루는 데 있어 전례 없는 도전 과제를 제기한다. 기존 대부분의 방법들은 대화 맥락을 단순한 텍스트로 취급하며, 중요한 발화자 인식 정보에 대한 주의를 충분히 기울이지 못하고 있다. 본 연구에서는 마스킹 어텐션과 이질적 그래프 네트워크를 결합한 개선된 발화자 인식 모델을 제안하여, 발화자 속성과 발화자 인식 관계 양 측면에서 대화적 단서를 포괄적으로 포착한다. 이러한 포괄적인 발화자 인식 모델링을 통해 실험 결과, 기준 데이터셋 Molweni에서 최고 수준의 성능을 달성함을 확인할 수 있었다. 사례 분석을 통해 본 모델이 발화와 각 발화자의 연결성을 강화하고, 발화자 인식 대화 관계를 효과적으로 포착함으로써 대화 모델링에 있어 핵심적인 역할을 수행함을 확인할 수 있었다.

향상된 스피커 인식 다자간 다턴 다이얼로그 이해 | 최신 연구 논문 | HyperAI초신경