HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التعرف على إجراءات AVA

التاريخ

منذ 3 أعوام

الحجم

52.82 MB

المؤسسة

جامعة كاليفورنيا بيركلي

عنوان URL للنشر

research.google.com

رابط الورقة البحثية

arxiv.org

الترخيص

CC BY 4.0

Featured Image

AVA، واسمها الكامل هو Atomic Visual Actions، عبارة عن مجموعة بيانات فيديو تحتوي على تعليقات صوتية ومرئية مصممة لتدريب الروبوتات على فهم الأنشطة البشرية. يتم شرح كل مقطع فيديو بالتفصيل من قبل المعلقين، مما يعكس المشاهد المتنوعة، وظروف التسجيل، وتعبيرات الأنشطة البشرية.

تتضمن تعليقات مجموعة البيانات ما يلي:

  • الحركية (AVA-Kinetics): هي تقاطع بين AVA وKinetics. لتوفير تسميات عمل محلية على مجموعة أوسع من المشاهد المرئية، يقدم المؤلفون تسميات عمل AVA على مقاطع فيديو Kinetics-700، مما يؤدي إلى مضاعفة العدد الإجمالي للشروح وزيادة عدد مقاطع الفيديو لفئات معينة بأكثر من 500 مرة.
  • الإجراءات (AvA-Actions): تقوم مجموعة بيانات AVA بشرح 80 إجراءً بصريًا ذريًا بشكل مكثف في 430 مقطع فيديو مدته 15 دقيقة. تقع هذه الإجراءات في المكان والزمان، مما يؤدي إلى توليد 1.62 مليون تسمية إجراء، يتم استخدام عدد كبير منها بشكل متكرر.
  • النشاط المنطوق (AVA ActiveSpeaker، AVA Speech): يربط AVA ActiveSpeaker الأصوات والوجوه المرئية في مقاطع فيديو AVA v1.0، مما يؤدي إلى إنشاء 3.65 مليون إطار مُسمَّاة بما يقرب من 39000 وجه. يقوم AVA Speech بشرح نشاط الكلام بشكل مكثف في مقاطع فيديو AVA v1.0 ويشرح بشكل صريح ثلاث حالات ضوضاء خلفية، مما يؤدي إلى إنتاج ما يقرب من 4600 مقطع فيديو موضحًا على مدار 45 ساعة.
AVA.torrent
البذر 1جارٍ التنزيل 0مكتمل 711إجمالي التنزيلات 767
  • AVA/
    • README.md
      1.9 KB
    • README.txt
      3.79 KB
      • data/
          • AVA Actions (v2.2)/
            • ava_included_timestamps_v2.2.txt
              8.17 KB
            • ava_test_excluded_timestamps_v2.2.csv
              9.27 KB
            • ava_train_excluded_timestamps_v2.2.csv
              11.94 KB
            • ava_train_v2.2.csv.zip
              5.44 MB
            • ava_v2.2.zip
              12.81 MB
            • ava_val_excluded_timestamps_v2.2.csv
              12.81 MB
            • ava_val_v2.2.csv.zip
              14.34 MB
          • AVA Active Speaker (v1.0)/
            • ava_activespeaker_train_v1.0.tar.bz2
              31.69 MB
            • ava_activespeaker_val_v1.0.tar.bz2
              36.55 MB
          • AVA Speech (v1.0)/
            • ava_speech_labels_v1.csv
              38.11 MB
          • AVA-Kinetics (v1.0)/
            • ava_kinetics_v1_0.tar.gz
              52.82 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp