HyperAIHyperAI

Command Palette

Search for a command to run...

Unitail:零售场景中的检测、阅读与匹配

Fangyi Chen Han Zhang Zaiwang Li Jiachen Dou Shentong Mo Hao Chen Yongxin Zhang Uzair Ahmed Chenchen Zhu Marios Savvides

摘要

为了在商店中充分利用计算机视觉技术,需要考虑符合零售场景特点的实际需求。为此,我们引入了联合零售数据集(United Retail Datasets,简称 Unitail),这是一个大规模基准数据集,涵盖了产品检测、读取和匹配等基本视觉任务,对算法提出了挑战。Unitail 数据集中标注了 180 万个四边形实例,提供了一个能够更好地对齐产品外观的检测数据集。此外,它还提供了一个画廊式的光学字符识别(OCR)数据集,包含 1454 个产品类别、30,000 个文本区域和 21,000 条转录文本,以实现产品上的稳健读取并促进改进的产品匹配。除了使用各种最先进方法对这些数据集进行基准测试外,我们还定制了一种新的产品检测器,并提供了一种基于 OCR 的简单匹配解决方案,验证了其有效性。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供