HyperAIHyperAI
منذ 13 أيام

NL2CMD: مسار عمل محدّث للترجمة من اللغة الطبيعية إلى أوامر Bash

Quchen Fu, Zhongwei Teng, Marco Georgaklis, Jules White, Douglas C. Schmidt
NL2CMD: مسار عمل محدّث للترجمة من اللغة الطبيعية إلى أوامر Bash
الملخص

ترجمة اللغة الطبيعية إلى أوامر Bash تُعد مجالًا بحثيًا ناشئًا حظي باهتمام متزايد في السنوات الأخيرة. ركزت معظم الجهود على تطوير نماذج ترجمة أكثر دقة. وبقدر معرفتنا، فإن هناك فقط مجموعتين بيانات متاحتين، وتعتمد إحداهما على الأخرى. وتشمل كلتا المجموعتين جمع بيانات من مصادر معروفة (من خلال منصات مثل Stack Overflow، والعمل الجماعي عبر الإنترنت، إلخ)، بالإضافة إلى توظيف خبراء لتأكيد صحة أو تصحيح النص الإنجليزي أو أوامر Bash. تقدم هذه الورقة مساهمتين رئيسيتين في بحث توليد أوامر Bash من الصفر. أولاً، نصف نموذج ترجمة حديث يُستخدم لتوليد أوامر Bash من النص الإنجليزي المقابل. ثانيًا، نُقدّم مجموعة بيانات جديدة تُسمى NL2CMD، تم إنشاؤها تلقائيًا، وتحتاج إلى تدخل بشري ضئيل، وتمتد إلى أكثر من ست مرات حجم المجموعات السابقة. وبما أن خط أنابيب التوليد لا يعتمد على أوامر Bash موجودة مسبقًا، يمكن تخصيص التوزيع وأنواع الأوامر حسب الحاجة. قمنا بتقييم أداء ChatGPT في هذا المهمة، وناقشنا إمكانية استخدامه كمُولِّد بيانات. وتُظهر النتائج التجريبية كيف يمكن لحجم وتنوع مجموعتنا أن يُوفّر فرصًا فريدة للباحثين في مجال التحليل الدلالي.

NL2CMD: مسار عمل محدّث للترجمة من اللغة الطبيعية إلى أوامر Bash | أحدث الأوراق البحثية | HyperAI