HyperAI

مجموعة بيانات التفكير المالي Finance-Instruct-500k

التاريخ

منذ 4 أيام

رابط النشر

huggingface.co

الترخيص

Apache 2.0

الفئات

مساعدة التنزيل

Finance-Instruct-500k عبارة عن مجموعة بيانات تفكير مالي مصممة لتدريب نماذج اللغة عالية المستوى للمهام المالية والتفكير والحوار متعدد الأدوار.

تحتوي مجموعة البيانات على أكثر من 500000 بيانات عالية الجودة في المجال المالي، وتغطي الإجابة على الأسئلة المالية، والاستدلال، وتحليل المشاعر، وتصنيف الموضوعات، والتعرف على الكيانات المسماة متعددة اللغات، والذكاء الاصطناعي المحادثي.

ميزات مجموعة البيانات:

  • حوار متعدد الجولات: محتوى حوار غني، يركز على الفهم السياقي والقدرة على التفكير.
  • مصادر بيانات متنوعة: تحتوي على بيانات من مجموعات بيانات متعددة عالية الجودة مثل Cinder وSujet-Finance-Instruct-177k.
  • بيانات تنسيق RAG: في مهمة إنشاء زيادة الاسترجاع (RAG)، يتم إلحاق البيانات الخارجية قبل حقل المستخدم لتحسين فهم السياق.
  • إزالة التكرار والمعالجة المسبقة: قم بإزالة الإدخالات المتداخلة وغير المنتظمة للحصول على بيانات أنظف وأعلى جودة.
  • علامات XBRL: تحتوي على علامات الكيان المالي المنظمة من Financial-NER-NLP لمهام الاستخراج المتقدمة.