استكشاف إمكانات النماذج اللغوية الكبيرة لاستخراج قيم خصائص المنتج

تتطلب منصات التجارة الإلكترونية بيانات منتجات مهيكلة على شكل أزواج صفة-قيمة لتوفير ميزات مثل البحث المنتج المتمايز أو مقارنة المنتجات بناءً على الصفات. ومع ذلك، غالبًا ما يوفر البائعون وصفات منتجات غير مهيكلة، مما يجعل استخراج أزواج الصفة-القيمة من هذه النصوص أمرًا ضروريًا. تواجه طرق الاستخراج المستندة إلى BERT الحاجة إلى كميات كبيرة من البيانات التدريبية الخاصة بالمهمة وتتعثر مع قيم الصفات غير المعروفة سابقًا. يستكشف هذا البحث استخدام نماذج اللغة الكبيرة (LLMs) كبديل أكثر كفاءة في استخدام البيانات التدريبية وأكثر متانة. نقترح قوالب دفع للسيناريوهات بدون تعلم (zero-shot) وبقليل من التعلم (few-shot)، مقارنين بين تمثيلات المخطط الهدف النصية والمبنية على JSON. تظهر تجاربنا أن GPT-4 يحقق أعلى متوسط درجة F1 بمقدار 85% باستخدام وصفات صفات مفصلة وعروض توضيحية. ويؤدي Llama-3-70B بشكل قريب جدًا، مما يقدم بديلاً تنافسياً مفتوح المصدر. يتفوق GPT-4 على أفضل خط أساس لنموذج اللغة المعالج بنسبة 5% في درجة F1. زيادة الأداء عن طريق التعديل الدقيق لـ GPT-3.5 تصل إلى مستوى GPT-4 ولكنها تقلل من قدرة النموذج على التعميم إلى قيم الصفات غير المعروفة سابقًا.