8 个月前

计算机视觉

计算机视觉

Junnan Li Qi Zhao Yongkang Wong Mohan S. Kankanhalli

摘要

自早期文明开始以来，每个人的社会关系从根本上构成了我们日常生活中社会结构的基础。在计算机视觉领域，场景理解方面已经取得了显著进展，例如物体检测和场景解析。近期的研究重点在于基于物体的功能性和几何关系来研究物体之间的关系。本研究旨在探讨静态图像中的社会关系识别问题。我们提出了一种双重视角模型用于社会关系识别，其中第一视角聚焦于感兴趣的个体对，第二视角则通过注意力机制探索上下文线索。此外，我们还收集了一个新的大规模“社交情境中的人”（People in Social Context, PISC）数据集，该数据集包含22,670张图像和76,568个标注样本，涵盖了9种类型的社会关系。我们在PISC数据集上提供了基准测试结果，并定性展示了所提模型的有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Junnan Li Qi Zhao Yongkang Wong Mohan S. Kankanhalli

摘要

自早期文明开始以来，每个人的社会关系从根本上构成了我们日常生活中社会结构的基础。在计算机视觉领域，场景理解方面已经取得了显著进展，例如物体检测和场景解析。近期的研究重点在于基于物体的功能性和几何关系来研究物体之间的关系。本研究旨在探讨静态图像中的社会关系识别问题。我们提出了一种双重视角模型用于社会关系识别，其中第一视角聚焦于感兴趣的个体对，第二视角则通过注意力机制探索上下文线索。此外，我们还收集了一个新的大规模“社交情境中的人”（People in Social Context, PISC）数据集，该数据集包含22,670张图像和76,568个标注样本，涵盖了9种类型的社会关系。我们在PISC数据集上提供了基准测试结果，并定性展示了所提模型的有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供