HyperAIHyperAI

Command Palette

Search for a command to run...

DISC-Law-SFT مجموعة بيانات ضبط الرقابة القانونية الصينية عالية الجودة

التاريخ

منذ 2 أعوام

الحجم

80.22 MB

المؤسسة

جامعة فودان

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.

مجموعة بيانات DISC-Law-SFT هي مجموعة بيانات ضبط دقيق خاضعة للإشراف (SFT) عالية الجودة أنشأها مختبر استخبارات البيانات والحوسبة الاجتماعية بجامعة فودان (Fudan-DISC) في عام 2023. تُستخدم لتدريب وتعزيز قدرات تطبيق نماذج اللغة الكبيرة (LLMs) في المجال القانوني وتحتوي على ما يقرب من 300000 بيانات تدريب. تم تصميم مجموعة البيانات هذه خصيصًا للمجال القانوني الصيني، بهدف تحسين قدرات النموذج في معالجة النصوص القانونية، والتفكير المنطقي القانوني، واسترجاع المعرفة والامتثال في المجال القضائي. الورقة ذات الصلة هيDISC-LawLLM: ضبط نماذج اللغات الكبيرة للخدمات القانونية الذكية"

تحتوي مجموعة البيانات على مجموعتين فرعيتين: DISC-Law-SFT-Pair وDISC-Law-SFT-Triplet. تعمل مجموعة DISC-Law-SFT-Pair على تقديم قدرات التفكير القانوني من خلال طريقة بناء زوج التعليمات للقياس القانوني، بينما تعمل مجموعة DISC-Law-SFT-Triplet على تعزيز قدرة النموذج على استخدام المعرفة الخارجية من خلال بناء ثلاثيات تحتوي على معلومات الإدخال والإخراج والمرجع.

تتضمن مصادر البيانات لمجموعة البيانات بشكل أساسي ثلاثة أجزاء: مجموعات البيانات العامة لمهام معالجة اللغة الطبيعية القضائية المتعلقة بالقانون الصيني، والنصوص القانونية الأصلية من العالم الحقيقي، ومجموعات البيانات العامة مفتوحة المصدر. وتضمن مثل هذه المصادر للبيانات تنوع وثراء مجموعة البيانات.

DISC-Law-SFT.torrent
البذر 1جارٍ التنزيل 0مكتمل 213إجمالي التنزيلات 795
  • DISC-Law-SFT/
    • README.md
      1.88 KB
    • README.txt
      3.77 KB
      • data/
        • DISC-Law-SFT.zip
          80.22 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp