مجموعة بيانات ما قبل التدريب لحوار حركة المرور TransGPT-pt&sft
التاريخ
الحجم
رابط النشر
الفئات
* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.
تُعد مجموعة البيانات هذه جزءًا من TransGPT، أول نموذج شامل للنقل في الصين، والذي أصدرته جامعة بكين جياوتونغ في عام 2024. وتحتوي على حوالي 346000 قطعة من بيانات النصوص في مجال النقل، والتي تُستخدم للتدريب المسبق في هذا المجال، وحوالي 58000 قطعة من بيانات الحوار في مجال النقل للضبط الدقيق. نتائج الورقة ذات الصلة هيTransGPT: محول توليدي متعدد الوسائط مُدرَّب مسبقًا للنقل".
تشمل مصادر البيانات بيانات أحادية النمط ومتعددة الأنماط، مثل موسوعات إشارات المرور، وبنوك أسئلة اختبار القيادة، والمعالم السياحية العالمية، وما إلى ذلك. وتغطي مجموعة البيانات العديد من الصناعات المتعلقة بالنقل، بما في ذلك هندسة الطرق، وهندسة الجسور، وهندسة الأنفاق، ونقل الطرق السريعة، ونقل المياه، والنقل العام الحضري، واقتصاد النقل، وسلامة النقل، وما إلى ذلك، وتوفر المعرفة العامة.