HyperAIHyperAI
منذ 2 أشهر

إيجاد أنابيب العمل

Georgia Gkioxari; Jitendra Malik
إيجاد أنابيب العمل
الملخص

نتناول مشكلة اكتشاف الأنشطة في الفيديوهات. بفضل التقدم الأخير في مجال اكتشاف الأشياء من الصور ثنائية البعد، نقوم ببناء نماذج للأنشطة باستخدام هياكل ميزات غنية مستمدة من العلامات الشكلية والحركة. ندمج المظهر والحركة بطريقتين. أولاً، بدءًا من مقترحات المناطق في الصورة، نختار تلك التي تتميز بالحركة بشكل كبير وبالتالي يكون من المرجح أن تحتوي على النشاط. هذا يؤدي إلى تقليل كبير في عدد المناطق المعالجة ويجعل الحسابات أسرع. ثانياً، نستخرج تمثيلات ميزات الزمانية-المكانية لبناء تصنيفات قوية باستخدام شبكات العصبونات المت convoled (Convolutional Neural Networks). نربط توقعاتنا لإنتاج اكتشافات متسقة زمنيًا، والتي نطلق عليها أنابيب الأنشطة (action tubes). نوضح أن طريقتنا تتفوق على التقنيات الأخرى في مهمة اكتشاف الأنشطة.

إيجاد أنابيب العمل | أحدث الأوراق البحثية | HyperAI