HyperAIHyperAI

Command Palette

Search for a command to run...

استكشاف إمكانات النماذج اللغوية الكبيرة لاستخراج قيم خصائص المنتج

Alexander Brinkmann Roe Shraga Christian Bizer

الملخص

تتطلب منصات التجارة الإلكترونية بيانات منتجات مهيكلة على شكل أزواج صفة-قيمة لتوفير ميزات مثل البحث المنتج المتمايز أو مقارنة المنتجات بناءً على الصفات. ومع ذلك، غالبًا ما يوفر البائعون وصفات منتجات غير مهيكلة، مما يجعل استخراج أزواج الصفة-القيمة من هذه النصوص أمرًا ضروريًا. تواجه طرق الاستخراج المستندة إلى BERT الحاجة إلى كميات كبيرة من البيانات التدريبية الخاصة بالمهمة وتتعثر مع قيم الصفات غير المعروفة سابقًا. يستكشف هذا البحث استخدام نماذج اللغة الكبيرة (LLMs) كبديل أكثر كفاءة في استخدام البيانات التدريبية وأكثر متانة. نقترح قوالب دفع للسيناريوهات بدون تعلم (zero-shot) وبقليل من التعلم (few-shot)، مقارنين بين تمثيلات المخطط الهدف النصية والمبنية على JSON. تظهر تجاربنا أن GPT-4 يحقق أعلى متوسط درجة F1 بمقدار 85% باستخدام وصفات صفات مفصلة وعروض توضيحية. ويؤدي Llama-3-70B بشكل قريب جدًا، مما يقدم بديلاً تنافسياً مفتوح المصدر. يتفوق GPT-4 على أفضل خط أساس لنموذج اللغة المعالج بنسبة 5% في درجة F1. زيادة الأداء عن طريق التعديل الدقيق لـ GPT-3.5 تصل إلى مستوى GPT-4 ولكنها تقلل من قدرة النموذج على التعميم إلى قيم الصفات غير المعروفة سابقًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp