HyperAIHyperAI
منذ 2 أشهر

التدوين على نوع العمود باستخدام ChatGPT

Keti Korini; Christian Bizer
التدوين على نوع العمود باستخدام ChatGPT
الملخص

التصنيف النوعي للعمود هو مهمة تضمين أنواع القيم الدلالية في أعمدة الجدول العلائقي. يعتبر التصنيف النوعي للعمود خطوة معالجة أولية مهمة لبحث البيانات ودمجها في سياق بحيرات البيانات. تعتمد طرق التصنيف النوعي للعمود الأكثر تقدماً إما على مطابقة أعمدة الجدول مع خصائص الرسم البياني للمعرفة أو على ضبط نماذج اللغة المدربة مسبقًا مثل BERT (BERT) لتصنيف أنواع الأعمدة. في هذا البحث، نتبع منهجًا مختلفًا ونستكشف استخدام ChatGPT (ChatGPT) لتصنيف أنواع الأعمدة. نقيم تصاميم مختلفة للدعوات في بيئات الصفرية والقليلية، ونجري تجارب باستخدام تعريفات المهمة وتوجيهات مفصلة للنموذج. بالإضافة إلى ذلك، نقوم بتنفيذ خط أنابيب تصنيف جدول من خطوتين يحدد أولاً فئة الكيانات الموصوفة في الجدول، ثم اعتمادًا على هذه الفئة، يطلب من ChatGPT (ChatGPT) تصنيف الأعمدة باستخدام مجموعة فرعية فقط من المفردات الكلية ذات الصلة. باستخدام التوجيهات وكذلك خط الأنابيب ذو الخطوتين، يصل ChatGPT (ChatGPT) إلى درجات F1 تزيد عن 85% في بيئات الصفرية والواحدة. لتحقيق درجة F1 مشابهة، يحتاج النموذج RoBERTa (RoBERTa) إلى ضبطه باستخدام 356 مثالاً. يظهر هذا المقارنة أن ChatGPT (ChatGPT) قادر على تقديم نتائج تنافسية لمهمة تصنيف أنواع الأعمدة عند عدم وجود أو وجود عدد قليل جداً من العروض الخاصة بالمهمة.

التدوين على نوع العمود باستخدام ChatGPT | أحدث الأوراق البحثية | HyperAI