说话人分割 | SOTA | HyperAI超神经

Speaker Diarization 是指通过分割和共索引音频记录来识别说话人。其主要目标是检测同一说话人的语音片段边界，并将这些片段归类到同一说话人名下，从而确定不同说话人的数量。结合语音识别技术，Speaker Diarization 可实现带说话人属性的语音转文字转录，具有重要的应用价值。

COS+NME-SC (Oracle SAD)

TitaNet-S (NME-SC)

pyannote (waveform)

Hub5'00 CallHome

call_home_american_english_speech

CALLHOME (NIST-SRE-2000 Disc8)