HyperAI

مجموعة بيانات استخراج علاقات الكيانات والكائنات متعددة الوسائط

التاريخ

منذ 7 أشهر

الحجم

2.86 GB

المؤسسة

رابط النشر

github.com

العلامات

MORE (مجموعة بيانات استخراج علاقات متعددة الوسائط بين الكائنات والكيانات) هي مجموعة بيانات لاستخراج علاقات متعددة الوسائط بين الكائنات والكيانات اقترحها مختبر المفاتيح الوطني بجامعة نانجينغ في عام 2024. نتائج الورقة البحثية ذات الصلة هي "المزيد: مجموعة بيانات استخراج علاقات متعددة الوسائط بين الكائنات والكيانات مع تقييم معياري".

تمثل هذه المجموعة من البيانات، من خلال الجمع بين معلومات النص والصورة، تحديًا معقدًا لنماذج التعلم الآلي لاستخراج الكيانات بدقة من النص وإنشاء علاقات صحيحة مع الكائنات المرئية في الصور. تحتوي مجموعة بيانات MORE على 21 نوعًا مختلفًا من العلاقات، تغطي 20,264 حقيقة علاقة متعددة الوسائط موضحة بـ 3,559 زوجًا من التعليقات النصية والصور المقابلة. تتضمن كل حقيقة في مجموعة البيانات كيانات يتم التعرف عليها من النص وكائنات يتم اكتشافها من الصور، وهو ما يتطلب من النموذج ليس فقط فهم محتوى النص ولكن أيضًا أن يكون قادرًا على التعرف على محتوى الصورة وفهمه. بالإضافة إلى ذلك، تحتوي مجموعة البيانات على 13,520 كائنًا مرئيًا، بمعدل 3.8 كائنًا لكل صورة.

يؤدي مثال MORE، بما في ذلك كيانان من النص والعديد من الكائنات المرئية من الصور، إلى إنشاء حقيقتين جديدتين لعلاقتين متعددتي الوسائط.

MORE.torrent
البذر 2التنزيل 0مكتمل 123إجمالي التنزيلات 103
  • MORE/
    • README.md
      1.84 KB
    • README.txt
      3.67 KB
      • data/
        • A-Multimodal-Object-Entity-Relation-Extraction-Dataset.zip
          2.86 GB