Command Palette
Search for a command to run...
Xu Zhao Ruibo Ma Jiaqi Chen Weiqi Zhao Ping Yang Yao Hu

摘要
精准预测用户观看时长对于提升短视频平台的用户参与度至关重要,然而这一任务面临多粒度层级下复杂分布特性的挑战。通过对真实工业数据的系统性分析,我们从分布角度揭示了观看时长预测中的两个关键难题:(1)由于大量快速跳过行为导致的粗粒度偏斜;(2)由多样化的用户-视频交互模式引发的细粒度多样性。为此,我们假设观看时长服从指数-高斯混合(Exponential-Gaussian Mixture, EGM)分布,其中指数分布与高斯分布分别刻画了分布的偏斜性与多样性特征。基于此,我们提出一种指数-高斯混合网络(Exponential-Gaussian Mixture Network, EGMN),用于对EGM分布进行参数化建模,该网络包含两个核心模块:隐表示编码器与混合分布参数生成器。我们在公开数据集上开展了广泛的离线实验,并在小红书App的工业级短视频推荐场景中进行了在线A/B测试,验证了EGMN相较于现有最先进方法的优越性。显著的是,全面的实验结果证明,EGMN在从粗粒度到细粒度的多个层级上均展现出优异的分布拟合能力。