HyperAI超神经

Speaker Diarization

Speaker Diarization 是指通过分割和共索引音频记录来识别说话人。其主要目标是检测同一说话人的语音片段边界,并将这些片段归类到同一说话人名下,从而确定不同说话人的数量。结合语音识别技术,Speaker Diarization 可实现带说话人属性的语音转文字转录,具有重要的应用价值。