HyperAI

مجموعة بيانات التعرف على إجراءات AVA

التاريخ

منذ 3 أعوام

الحجم

52.82 MB

المؤسسة

جامعة كاليفورنيا بيركلي

رابط النشر

research.google.com

الترخيص

CC BY 4.0

特色图像

AVA، واسمها الكامل هو Atomic Visual Actions، عبارة عن مجموعة بيانات فيديو تحتوي على تعليقات صوتية ومرئية مصممة لتدريب الروبوتات على فهم الأنشطة البشرية. يتم شرح كل مقطع فيديو بالتفصيل من قبل المعلقين، مما يعكس المشاهد المتنوعة، وظروف التسجيل، وتعبيرات الأنشطة البشرية.

تتضمن تعليقات مجموعة البيانات ما يلي:

  • الحركية (AVA-Kinetics): هي تقاطع بين AVA وKinetics. لتوفير تسميات عمل محلية على مجموعة أوسع من المشاهد المرئية، يقدم المؤلفون تسميات عمل AVA على مقاطع فيديو Kinetics-700، مما يؤدي إلى مضاعفة العدد الإجمالي للشروح وزيادة عدد مقاطع الفيديو لفئات معينة بأكثر من 500 مرة.
  • الإجراءات (AvA-Actions): تقوم مجموعة بيانات AVA بشرح 80 إجراءً بصريًا ذريًا بشكل مكثف في 430 مقطع فيديو مدته 15 دقيقة. تقع هذه الإجراءات في المكان والزمان، مما يؤدي إلى توليد 1.62 مليون تسمية إجراء، يتم استخدام عدد كبير منها بشكل متكرر.
  • النشاط المنطوق (AVA ActiveSpeaker، AVA Speech): يربط AVA ActiveSpeaker الأصوات والوجوه المرئية في مقاطع فيديو AVA v1.0، مما يؤدي إلى إنشاء 3.65 مليون إطار مُسمَّاة بما يقرب من 39000 وجه. يقوم AVA Speech بشرح نشاط الكلام بشكل مكثف في مقاطع فيديو AVA v1.0 ويشرح بشكل صريح ثلاث حالات ضوضاء خلفية، مما يؤدي إلى إنتاج ما يقرب من 4600 مقطع فيديو موضحًا على مدار 45 ساعة.
AVA.torrent
البذر 1التنزيل 1مكتمل 496إجمالي التنزيلات 525
  • AVA/
    • README.md
      1.9 KB
    • README.txt
      3.79 KB
      • data/
          • AVA Actions (v2.2)/
            • ava_included_timestamps_v2.2.txt
              8.17 KB
            • ava_test_excluded_timestamps_v2.2.csv
              9.27 KB
            • ava_train_excluded_timestamps_v2.2.csv
              11.94 KB
            • ava_train_v2.2.csv.zip
              5.44 MB
            • ava_v2.2.zip
              12.81 MB
            • ava_val_excluded_timestamps_v2.2.csv
              12.81 MB
            • ava_val_v2.2.csv.zip
              14.34 MB
          • AVA Active Speaker (v1.0)/
            • ava_activespeaker_train_v1.0.tar.bz2
              31.69 MB
            • ava_activespeaker_val_v1.0.tar.bz2
              36.55 MB
          • AVA Speech (v1.0)/
            • ava_speech_labels_v1.csv
              38.11 MB
          • AVA-Kinetics (v1.0)/
            • ava_kinetics_v1_0.tar.gz
              52.82 MB