HyperAIHyperAI
منذ 15 أيام

التدوير الهرمي الفضائي-الزمني للهوية الشخصية القائمة على الفيديو

{Dong Wang, Hu Lu, Xia Geng, Shang Gao, Pingping Zhang, Yingquan Wang}
التدوير الهرمي الفضائي-الزمني للهوية الشخصية القائمة على الفيديو
الملخص

يهدف التعرف على الأشخاص بناءً على الفيديو إلى ربط مقاطع الفيديو الخاصة بالشخص نفسه عبر كاميرات متعددة غير متداخلة. يمكن لتمثيلات الفضاء-الزمن أن توفر معلومات أكثر غنىً وتكاملاً بين الإطارات، وهي أمر بالغ الأهمية لتمييز الشخص المستهدف عند حدوث انسدادات. تقدم هذه الورقة إطارًا جديدًا يُسمى "الجمع الهرمي الفضائي-الزمني" (PSTA) لجمع ميزات الإطارات بشكل تدريجي ودمج الميزات الزمنية الهرمية في تمثيل نهائية على مستوى الفيديو. وبذلك، يمكن استغلال المعلومات الزمنية قصيرة الأمد وطويلة الأمد بشكل فعّال من خلال هرميات مختلفة. علاوةً على ذلك، تم اقتراح وحدة جمع فضائية-زمنية (STAM) لتعزيز قدرة PSTA على الجمع. وتشمل هذه الوحدة ح Blocين جديدين للانتباه: "الانتباه المرجعي الفضائي" (SRA) و"الانتباه المرجعي الزمني" (TRA). يُركّز SRA على استكشاف الارتباطات الفضائية داخل إطار واحد لتحديد وزن الانتباه لكل موقع، بينما يُوسع TRA وظيفة SRA من خلال استكشاف الارتباطات بين الإطارات المجاورة، مما يسمح باستغلال كامل لمعلومات الاتساق الزمني لقمع الميزات المثيرة للتشويش وتعزيز الميزات التمييزية. أظهرت التجارب الواسعة على عدة معايير صعبة فعالية الإطار المقترح PSTA، حيث حقق النموذج الكامل دقة 91.5% و98.3% في تصنيف الرتبة الأولى (Rank-1) على معياري MARS وDukeMTMC-VID على التوالي.

التدوير الهرمي الفضائي-الزمني للهوية الشخصية القائمة على الفيديو | أحدث الأوراق البحثية | HyperAI