2ヶ月前

ExtractGPT: 大規模言語モデルの製品属性値抽出への可能性の探索

Alexander Brinkmann; Roee Shraga; Christian Bizer
ExtractGPT: 大規模言語モデルの製品属性値抽出への可能性の探索
要約

電子商取引プラットフォームは、属性-値ペアの形式で構造化された製品データを必要とし、これにより多面的な製品検索や属性に基づく製品比較などの機能を提供できます。しかし、販売業者はしばしば非構造化された製品説明を提供するため、これらのテキストから属性-値ペアを抽出する必要があります。BERTベースの抽出方法は大量のタスク固有の学習データを必要とし、未見の属性値に苦戦します。本論文では、大規模言語モデル(LLMs)を使用することで、より少ない学習データで効率的に且つ堅牢な代替手段となる可能性を探ります。我々はゼロショットおよびファーソットシナリオ向けのプロンプトテンプレートを提案し、テキストベースとJSONベースの目標スキーマ表現を比較しました。実験結果によると、GPT-4は詳細な属性説明とデモンストレーションを使用して平均F1スコア85%を達成しました。Llama-3-70Bもそれに近い性能を示し、競合可能なオープンソースの代替手段となっています。GPT-4は最良のPLM基準モデルよりもF1スコアで5%上回っています。GPT-3.5の微調整は性能をGPT-4と同じレベルまで向上させますが、未見の属性値に対する汎化能力が低下します。

ExtractGPT: 大規模言語モデルの製品属性値抽出への可能性の探索 | 最新論文 | HyperAI超神経