6 个月前

自然语言处理

自然语言处理

Ruize Wang Zhongyu Wei Ying Cheng Piji Li Haijun Shan Ji Zhang Qi Zhang Xuanjing Huang

摘要

视觉叙事旨在从一组图像序列中自动生成连贯的叙事段落。现有的方法通常独立地为每张图像生成文本描述，再将其粗略拼接成故事，导致生成内容在语义上缺乏连贯性。本文提出一种新的视觉叙事方法，通过引入主题描述任务，以识别图像序列的全局语义上下文，进而基于该主题描述引导故事的生成。为有效融合主题描述生成与故事生成两项任务，我们设计了一种多智能体通信框架，将主题描述生成器与故事生成器视为两个智能体，并通过迭代更新机制实现两者的协同学习。我们在VIST数据集上验证了所提方法的有效性，定量实验、消融研究及人工评估结果均表明，相较于当前最优方法，本方法在生成高质量、语义连贯的故事方面具有显著优势。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

自然语言处理

Ruize Wang Zhongyu Wei Ying Cheng Piji Li Haijun Shan Ji Zhang Qi Zhang Xuanjing Huang

摘要

视觉叙事旨在从一组图像序列中自动生成连贯的叙事段落。现有的方法通常独立地为每张图像生成文本描述，再将其粗略拼接成故事，导致生成内容在语义上缺乏连贯性。本文提出一种新的视觉叙事方法，通过引入主题描述任务，以识别图像序列的全局语义上下文，进而基于该主题描述引导故事的生成。为有效融合主题描述生成与故事生成两项任务，我们设计了一种多智能体通信框架，将主题描述生成器与故事生成器视为两个智能体，并通过迭代更新机制实现两者的协同学习。我们在VIST数据集上验证了所提方法的有效性，定量实验、消融研究及人工评估结果均表明，相较于当前最优方法，本方法在生成高质量、语义连贯的故事方面具有显著优势。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供