6 个月前

自然语言处理

自然语言处理

Chi-Yang Hsu Yun-Wei Chu Ting-Hao &#39 Kenneth&#39 Huang Lun-Wei Ku

摘要

撰写一篇连贯且引人入胜的故事并非易事。创意写作者凭借自身的知识积累与世界观，将零散的元素有机整合，构建出逻辑清晰的叙事脉络，并通过反复推敲与修改，不断追求完善。然而，现有的自动化视觉叙事（Automated Visual Storytelling, VIST）模型在生成故事时，往往未能有效利用外部知识，也缺乏迭代生成机制。为此，本文提出PR-VIST框架，该框架将输入的图像序列表示为一个故事图（story graph），并在其中寻找最优路径以构建叙事主线。随后，PR-VIST基于该路径，通过迭代式训练过程学习生成最终故事。实验结果表明，该框架生成的故事在多样性、连贯性与人类自然度方面均显著优于现有方法，且在自动评估与人工评估中均表现优异。消融实验进一步验证了“情节构建”（plotting）与“反复打磨”（reworking）两个关键环节对模型性能提升的重要贡献。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

自然语言处理

Chi-Yang Hsu Yun-Wei Chu Ting-Hao &#39 Kenneth&#39 Huang Lun-Wei Ku

摘要

撰写一篇连贯且引人入胜的故事并非易事。创意写作者凭借自身的知识积累与世界观，将零散的元素有机整合，构建出逻辑清晰的叙事脉络，并通过反复推敲与修改，不断追求完善。然而，现有的自动化视觉叙事（Automated Visual Storytelling, VIST）模型在生成故事时，往往未能有效利用外部知识，也缺乏迭代生成机制。为此，本文提出PR-VIST框架，该框架将输入的图像序列表示为一个故事图（story graph），并在其中寻找最优路径以构建叙事主线。随后，PR-VIST基于该路径，通过迭代式训练过程学习生成最终故事。实验结果表明，该框架生成的故事在多样性、连贯性与人类自然度方面均显著优于现有方法，且在自动评估与人工评估中均表现优异。消融实验进一步验证了“情节构建”（plotting）与“反复打磨”（reworking）两个关键环节对模型性能提升的重要贡献。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供