
摘要
我们提交的主要系统由11个子系统构成,符合任务要求。其中,3个子系统基于声学关键词检测(Acoustic Keyword Spotting, AKWS),8个子系统基于动态时间规整(Dynamic Time Warping, DTW)。AKWS子系统仅使用音素后验概率(phoneme posteriors)作为输入,而DTW子系统则同时使用音素后验概率和瓶颈特征(Bottle-Neck features, BN)作为输入。用于生成音素后验概率的估计器以及瓶颈特征提取器,均包含基于目标语言(捷克语)和非目标语言(其他4种语言)的模型。此外,我们还针对T1/T2/T3类查询进行了实验,并基于二元逻辑回归方法开展了系统校准与融合研究。