2 个月前

Unitail:零售场景中的检测、阅读与匹配

Chen, Fangyi ; Zhang, Han ; Li, Zaiwang ; Dou, Jiachen ; Mo, Shentong ; Chen, Hao ; Zhang, Yongxin ; Ahmed, Uzair ; Zhu, Chenchen ; Savvides, Marios
Unitail:零售场景中的检测、阅读与匹配
摘要

为了在商店中充分利用计算机视觉技术,需要考虑符合零售场景特点的实际需求。为此,我们引入了联合零售数据集(United Retail Datasets,简称 Unitail),这是一个大规模基准数据集,涵盖了产品检测、读取和匹配等基本视觉任务,对算法提出了挑战。Unitail 数据集中标注了 180 万个四边形实例,提供了一个能够更好地对齐产品外观的检测数据集。此外,它还提供了一个画廊式的光学字符识别(OCR)数据集,包含 1454 个产品类别、30,000 个文本区域和 21,000 条转录文本,以实现产品上的稳健读取并促进改进的产品匹配。除了使用各种最先进方法对这些数据集进行基准测试外,我们还定制了一种新的产品检测器,并提供了一种基于 OCR 的简单匹配解决方案,验证了其有效性。

Unitail:零售场景中的检测、阅读与匹配 | 最新论文 | HyperAI超神经