مجموعة بيانات DPO الشبيهة بالإنسان مجموعة بيانات ضبط الحوار النموذجي الكبير

التاريخ

منذ 10 أشهر

الحجم

19.05 MB

رابط الورقة البحثية

arxiv.org

العلامات

نموذج كبير

تنزيل مجموعة البيانات

انضم إلى مجتمع Discord

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.

مجموعة بيانات Human Like DPO هي مجموعة بيانات مصممة خصيصًا لتحسين الطلاقة المحادثة والمشاركة في نماذج اللغة الكبيرة. وهو مناسب للتنسيقات مثل تحسين التفضيل المباشر (DPO)، والذي يهدف إلى توجيه النموذج لتوليد استجابات أكثر تشابهًا بالإنسان. وتغطي مجموعة البيانات 256 موضوعًا وتحتوي على 10,884 عينة في مجالات مختلفة بما في ذلك التكنولوجيا والحياة اليومية والعلوم والتاريخ والفن.

تتكون كل عينة من 3 أجزاء: سؤال محادثة، رد فعل شبيه بالإنسان، واستجابة رسمية. تم تصميم الأسئلة المحادثة لتكون طبيعية ومثيرة للاهتمام، وتعكس محتوى المحادثات الإنسانية اليومية؛ تحاكي الاستجابات الشبيهة بالإنسان الإجابات الطبيعية الحوارية التي تنتجها التفاعلات البشرية؛ وتعكس الاستجابات الرسمية هيكل واحترافية استجابات الذكاء الاصطناعي التقليدية.

يمكن استخدام مجموعة البيانات لضبط نماذج اللغة الكبيرة لتحسين التماسك المحادثة، وتقليل الاستجابات الآلية أو غير الشخصية، وتعزيز الذكاء العاطفي في الأنظمة المحادثة. بهذه الطريقة، توفر Human-Like-DPO-Dataset دعمًا قويًا لتطوير أنظمة حوار أكثر طبيعية وشبه بشرية. نتائج الورقة ذات الصلة هيتعزيز الاستجابات الشبيهة بالإنسان في نماذج اللغة الكبيرة".

Human-Like-DPO-Dataset.torrent

البذر 1التنزيل 0مكتمل 135إجمالي التنزيلات 329

Human-Like-DPO-Dataset/
- README.md
  1.83 KB
- README.txt
  3.65 KB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي

وحدات معالجة رسومات جاهزة

أفضل الأسعار

ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp