HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات حوار الصور VisDial

Featured Image

VisDial، الاسم الكامل لـ Visual Dialog، عبارة عن مجموعة بيانات تحتوي على مشكلات التعليقات التوضيحية اليدوية استنادًا إلى الصور من مجموعة بيانات MS COCO.

تم تطوير مجموعة البيانات من خلال جعل شخصين يتحدثان عن صورة على Amazon Mechanical Turk. أحدهما يتصرف كسائل والآخر يتصرف كمجيب. لا يمكن للسائل رؤية سوى وصف النص الخاص بالصورة (أي عنوان الصورة من مجموعة بيانات MS COCO)، ولا يمكن للسائل رؤية الصورة الأصلية. وكانت مهمتهم طرح الأسئلة حول هذه الصورة من أجل "تصور المشهد بشكل أفضل". يرى المستفتى الصورة والتسمية التوضيحية ويجيب على السؤال الذي طرحه السائل. يمكن لكليهما مواصلة المحادثة عن طريق طرح الأسئلة والإجابة عليها، لمدة تصل إلى 10 جولات.

يتضمن VisDial v1.0 ما يلي:

  • مجموعة التدريب: 1,23,287 صورة، 10 جولات حوار لكل صورة؛
  • مجموعة التحقق: 2064 صورة، 10 جولات حوار لكل صورة؛
  • مجموعة الاختبار: 8000 صورة، دورة واحدة من الحوار لكل صورة.
VisDial.torrent
Seeding 1Downloading 0Completed 596Total Downloads 736
  • VisDial/
    • README.md
      1.58 KB
    • README.txt
      3.15 KB
      • data/
        • VisualDialog_test2018.zip
          1.2 GB
        • VisualDialog_val2018.zip
          1.51 GB
        • visdial_1.0_test.zip
          1.51 GB
        • visdial_1.0_train.zip
          1.85 GB
        • visdial_1.0_val.zip
          1.86 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp