2 个月前

ExtractGPT:探索大型语言模型在产品属性值提取中的潜力

Alexander Brinkmann; Roee Shraga; Christian Bizer
ExtractGPT:探索大型语言模型在产品属性值提取中的潜力
摘要

电子商务平台需要以属性值对的形式提供结构化的产品数据,以便实现诸如多维度产品搜索或基于属性的产品比较等功能。然而,供应商通常提供的产品描述是非结构化的,这需要从这些文本中提取属性值对。基于BERT的提取方法需要大量的特定任务训练数据,并且在处理未见过的属性值时表现不佳。本文探讨了使用大型语言模型(LLMs)作为更高效且稳健的替代方案。我们提出了适用于零样本和少样本场景的提示模板,并对比了文本和JSON格式的目标模式表示方法。实验结果表明,GPT-4 使用详细的属性描述和示例,达到了最高的平均F1分数85%。Llama-3-70B 的表现也几乎同样出色,提供了一个具有竞争力的开源替代方案。GPT-4 在F1分数上比最佳预训练语言模型(PLM)基线高出5%。微调GPT-3.5 可以提升性能至与GPT-4 相当的水平,但会降低模型对未见过的属性值的泛化能力。