18 天前

对话选择中的高效动态硬负样本采样

{and Honglak Lee., Stanley Jungkyu Choi, SeongHwan Kim, Jeesoo Bang, Hyunkyung Bae, Joongbo Shin, Dongkyu Lee, Janghoon Han}
对话选择中的高效动态硬负样本采样
摘要

近期研究已证明在选择任务中取得了显著进展,其中相当一部分成功归因于在训练过程中引入具有信息量的负样本。尽管传统构建难负样本的方法能够提供有意义的监督信号,但其依赖静态负样本,这些样本在训练过程中无法动态更新,因而导致性能受限。动态难负样本采样通过持续适应模型在训练过程中的状态变化,有效克服了这一局限。然而,该方法较高的计算开销限制了其在部分模型架构中的应用。为解决上述挑战,本文提出一种高效的动态难负样本采样方法(Efficient Dynamic Hard Negative Sampling, EDHNS)。EDHNS通过预先过滤易于区分的负样本,显著减少模型在训练过程中需计算的候选样本数量,从而提升效率。此外,该方法还主动排除模型已表现出高置信度的问题-候选对,不再对这些样本进行损失计算,进一步缩短训练时间。上述策略在保障学习质量的同时,大幅降低计算成本,优化了训练流程。在DSTC9、DSTC10、Ubuntu及电商领域等多个基准数据集上的大量实验表明,EDHNS显著优于基线模型,充分验证了其在对话选择任务中的有效性与实用性。