6 个月前

自然语言处理

自然语言处理

Naoaki Okazaki Ao Liu Youmi Ma Junfeng Jiang An Wang

摘要

方面情感四元组预测（Aspect Sentiment Quad Prediction, ASQP）旨在从文本中识别方面项（aspect terms）、观点项（opinion terms）、情感极性（sentiment polarity）以及方面类别（aspect categories）。该任务面临的一个主要挑战是由于标注成本高昂导致的数据稀缺问题。为缓解这一问题，数据增强技术被广泛采用。然而，现有方法通常仅对训练数据中的文本进行简单改写，导致生成数据的语义多样性受限，且因文本与四元组之间的一致性不足而影响了数据质量。针对上述局限，本文提出通过增强四元组并训练一个“四元组到文本”的生成模型，以生成与之对应的新文本。此外，我们设计了新颖的数据过滤策略，有效剔除低质量样本，并对增强数据集中的样本难度分布进行平衡。在两个ASQP基准数据集上的实证研究结果表明，所提方法优于现有的各类数据增强方法，并在多个基准测试中达到了当前最优（state-of-the-art）性能。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

自然语言处理

Naoaki Okazaki Ao Liu Youmi Ma Junfeng Jiang An Wang

摘要

方面情感四元组预测（Aspect Sentiment Quad Prediction, ASQP）旨在从文本中识别方面项（aspect terms）、观点项（opinion terms）、情感极性（sentiment polarity）以及方面类别（aspect categories）。该任务面临的一个主要挑战是由于标注成本高昂导致的数据稀缺问题。为缓解这一问题，数据增强技术被广泛采用。然而，现有方法通常仅对训练数据中的文本进行简单改写，导致生成数据的语义多样性受限，且因文本与四元组之间的一致性不足而影响了数据质量。针对上述局限，本文提出通过增强四元组并训练一个“四元组到文本”的生成模型，以生成与之对应的新文本。此外，我们设计了新颖的数据过滤策略，有效剔除低质量样本，并对增强数据集中的样本难度分布进行平衡。在两个ASQP基准数据集上的实证研究结果表明，所提方法优于现有的各类数据增强方法，并在多个基准测试中达到了当前最优（state-of-the-art）性能。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供