مجموعة بيانات استخراج علاقات الكيانات والكائنات متعددة الوسائط
التاريخ
الحجم
رابط النشر
العلامات
MORE (مجموعة بيانات استخراج علاقات متعددة الوسائط بين الكائنات والكيانات) هي مجموعة بيانات لاستخراج علاقات متعددة الوسائط بين الكائنات والكيانات اقترحها مختبر المفاتيح الوطني بجامعة نانجينغ في عام 2024. نتائج الورقة البحثية ذات الصلة هي "المزيد: مجموعة بيانات استخراج علاقات متعددة الوسائط بين الكائنات والكيانات مع تقييم معياري".
تمثل هذه المجموعة من البيانات، من خلال الجمع بين معلومات النص والصورة، تحديًا معقدًا لنماذج التعلم الآلي لاستخراج الكيانات بدقة من النص وإنشاء علاقات صحيحة مع الكائنات المرئية في الصور. تحتوي مجموعة بيانات MORE على 21 نوعًا مختلفًا من العلاقات، تغطي 20,264 حقيقة علاقة متعددة الوسائط موضحة بـ 3,559 زوجًا من التعليقات النصية والصور المقابلة. تتضمن كل حقيقة في مجموعة البيانات كيانات يتم التعرف عليها من النص وكائنات يتم اكتشافها من الصور، وهو ما يتطلب من النموذج ليس فقط فهم محتوى النص ولكن أيضًا أن يكون قادرًا على التعرف على محتوى الصورة وفهمه. بالإضافة إلى ذلك، تحتوي مجموعة البيانات على 13,520 كائنًا مرئيًا، بمعدل 3.8 كائنًا لكل صورة.
