HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات VizWiz للإجابة على الأسئلة المرئية للمكفوفين

التاريخ

منذ 3 أعوام

الحجم

17.65 GB

المؤسسة

جامعة تكساس في أوستن

رابط النشر

vizwiz.org

رابط الورقة البحثية

arxiv.org

الترخيص

CC BY 4.0

العلامات

Featured Image

VizWiz-VQA (الإجابة البصرية على الأسئلة) عبارة عن مجموعة بيانات صور للإجابة البصرية على الأسئلة للمكفوفين. يستخدم المستخدمون المكفوفون برنامج VizWiz لالتقاط صورة وتسجيل سؤال لفظي حول الصورة و10 إجابات جماعية على السؤال. تُستخدم مجموعة البيانات هذه لحل المشكلتين التاليتين: الأولى هي التنبؤ بإجابة سؤال مرئي، والثانية هي تحديد ما إذا كان من الممكن الإجابة على سؤال مرئي. تهدف مجموعة البيانات هذه إلى دراسة خوارزميات أكثر عمومية لمساعدة المكفوفين على حل عقبات الحياة.

تتضمن مجموعة البيانات (أحدث إصدار لعام 2020):

  • 20,523 زوجًا من الصور/الأسئلة التدريبية
  • 205,230 لإجابات التدريب/ثقة الإجابة
  • 4319 صور/أسئلة التحقق
  • 43,190 زوجًا من الإجابات التي تم التحقق منها / ثقة الإجابة
  • 8000 زوج من صور/أسئلة الاختبار
VisWiz.torrent
البذر 2التنزيل 0مكتمل 231إجمالي التنزيلات 383
  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • Annotations.zip
          178.55 MB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • val.zip
          17.65 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp