التاريخ

منذ 2 أعوام

الحجم

5.59 MB

المؤسسة

الوسوم

LLM

معالجة اللغة الطبيعية

لغة

نمذجة التفضيلات

مقدمة مجموعة البيانات

مجموعة بيانات DPO-zh-en-emoji هي مجموعة بيانات مصممة خصيصًا لضبط نماذج اللغة الكبيرة التي أطلقتها شركة shareAI في عام 2024، حيث يرمز "DPO" إلى تحسين التفضيلات المباشرة. تحتوي مجموعة البيانات هذه على عدد كبير من أزواج الأسئلة والأجوبة. يحتوي كل سؤال على نسختين من الإجابة، باللغتين الصينية والإنجليزية. وتتضمن الإجابات أيضًا عناصر ممتعة ومرحة، بما في ذلك استخدام الرموز التعبيرية. قام فريق البحث باختيار بعض الأسئلة بعناية من Zhihu والتفكير المنطقي ومنتدى المتخلفين عقليًا كاستعلامات، واستخدم نموذج التعليمات llama3 70b لعينة وإنشاء نسخة صينية من الإجابة ونسخة إنجليزية من الإجابة لكل استعلام. يساعد هذا التصميم على تنشيط تفضيلات نمط اللغة لنموذج الدردشة متعدد اللغات وتحسين جودة المحتوى الذي يولده النموذج وتوافقه مع التفضيلات البشرية.

DPO-zh-en-emoji.torrent

البذر 1جارٍ التنزيل 0مكتمل 155إجمالي التنزيلات 402

DPO-zh-en-emoji/
- README.md
  1.58 KB
- README.txt
  3.16 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار