8 个月前

监督式微调

自然语言处理

Alexander Brinkmann Roe Shraga Christian Bizer

摘要

电子商务平台需要以属性值对的形式提供结构化的产品数据，以便实现诸如多维度产品搜索或基于属性的产品比较等功能。然而，供应商通常提供的产品描述是非结构化的，这需要从这些文本中提取属性值对。基于BERT的提取方法需要大量的特定任务训练数据，并且在处理未见过的属性值时表现不佳。本文探讨了使用大型语言模型（LLMs）作为更高效且稳健的替代方案。我们提出了适用于零样本和少样本场景的提示模板，并对比了文本和JSON格式的目标模式表示方法。实验结果表明，GPT-4 使用详细的属性描述和示例，达到了最高的平均F1分数85%。Llama-3-70B 的表现也几乎同样出色，提供了一个具有竞争力的开源替代方案。GPT-4 在F1分数上比最佳预训练语言模型（PLM）基线高出5%。微调GPT-3.5 可以提升性能至与GPT-4 相当的水平，但会降低模型对未见过的属性值的泛化能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

监督式微调

自然语言处理

Alexander Brinkmann Roe Shraga Christian Bizer

摘要

电子商务平台需要以属性值对的形式提供结构化的产品数据，以便实现诸如多维度产品搜索或基于属性的产品比较等功能。然而，供应商通常提供的产品描述是非结构化的，这需要从这些文本中提取属性值对。基于BERT的提取方法需要大量的特定任务训练数据，并且在处理未见过的属性值时表现不佳。本文探讨了使用大型语言模型（LLMs）作为更高效且稳健的替代方案。我们提出了适用于零样本和少样本场景的提示模板，并对比了文本和JSON格式的目标模式表示方法。实验结果表明，GPT-4 使用详细的属性描述和示例，达到了最高的平均F1分数85%。Llama-3-70B 的表现也几乎同样出色，提供了一个具有竞争力的开源替代方案。GPT-4 在F1分数上比最佳预训练语言模型（PLM）基线高出5%。微调GPT-3.5 可以提升性能至与GPT-4 相当的水平，但会降低模型对未见过的属性值的泛化能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供