HyperAI

مجموعة استخراج المعلومات واسعة النطاق من IEPile 

التاريخ

منذ عام واحد

الحجم

1.83 MB

المؤسسة

جامعة تشجيانغ

رابط النشر

github.com

IEPile هي مجموعة بيانات ضبط تعليمات استخراج المعلومات (IE) ثنائية اللغة (الصينية والإنجليزية) واسعة النطاق وعالية الجودة، طورتها جامعة تشجيانغ، وتغطي ثلاث مهام فرعية أساسية: التعرف على الكيان المسمى (NER)، واستخراج العلاقات (RE)، واستخراج الأحداث (EE). تحتوي مجموعة البيانات على حوالي 2 مليون عينة تعليمات، بإجمالي حوالي 320 مليون رمز، تغطي مجالات متعددة مثل المجال العام والطبي والمالي.

عمل فريق البحث على ضمان الجودة العالية لمجموعة البيانات من خلال دمج 26 مجموعة بيانات إنجليزية و7 مجموعات بيانات صينية بعناية وتبني "طريقة بناء تعليمات الاستطلاع القائمة على المخطط" المقترحة، بما في ذلك بناء قاموس للعينات السلبية الصعبة وتوليد تعليمات الاستطلاع. يؤدي إنشاء IEPile إلى تحسين أداء النماذج الكبيرة في مهام استخراج المعلومات بشكل كبير، وخاصة قدرات التعميم بدون أخطاء، مما يوفر موارد قيمة لأبحاث استخراج المعلومات.

IEPile.torrent
البذر 3التنزيل 1مكتمل 203إجمالي التنزيلات 457
  • IEPile/
    • README.md
      1.47 KB
    • README.txt
      2.94 KB
      • data/
        • IEPile-main.zip
          1.83 MB