Command Palette

Search for a command to run...

Cops-Ref 目标物指代理解数据集

日期

2 年前

机构

The University of Hong Kong

发布地址

github.com

论文链接

arxiv.org

许可协议

其他

加入 Discord 社区
Featured Image

Cops-Ref 全称 Compositional Referring Expression Comprehension,是关于在目标物指代理解方面的视觉推理图像数据集。该数据集包含 75,299 张真实图像、 148,712 条文本描述和 1,307,885 个候选区域。

该数据集有两个主要特点,一是新的文本生成引擎,它能结合推理逻辑和视觉特征,进而生成不同复杂程度的文本描述;二是新的测试设置,在测试过程中对有语义相似的视觉图像进行干扰。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供