18 天前

基于文本的人员搜索中一种简单且鲁棒的相关性过滤方法

{Qi Wu, Yanning Zhang, Peng Wang, Yiqi Gao, Kai Niu, Mengyang Sun, Wei Suo}
基于文本的人员搜索中一种简单且鲁棒的相关性过滤方法
摘要

基于文本的人体检索旨在将行人图像与自然语言描述进行关联。在此任务中,提取具有区分性的特征并实现跨身份与描述之间的精准对齐,是一个关键但极具挑战性的问题。以往大多数方法依赖额外的语言解析器或视觉技术,从噪声输入中筛选出相关区域或关键词,但这类方法往往带来较高的计算开销,并存在不可避免的误差累积问题。此外,单纯采用水平分割图像来获取局部特征,也可能损害模型的可靠性。本文提出一种新颖的端到端、简单且鲁棒的关联滤波方法(Simple and Robust Correlation Filtering, SRCF),能够有效提取关键线索,并自适应地对齐判别性特征。与以往工作不同,本框架的核心思想是计算模板与输入之间的相似性。具体而言,我们设计了两种不同类型的滤波模块——去噪滤波器与词典滤波器,用于提取关键特征并建立多模态映射关系。大量实验结果表明,所提方法显著提升了模型的鲁棒性,并在两个主流的基于文本的人体检索数据集上取得了更优的性能表现。项目源代码已公开,获取地址为:https://github.com/Suo-Wei/SRCF。