كشف الأشياء في الزمن الحقيقي للاستشعار التدفقي

يتطلب القيادة الذاتية من النموذج إدراك البيئة والتفاعل معها ضمن زمن استجابة منخفض لضمان السلامة. في حين تجاهلت الدراسات السابقة التغيرات الضرورية في البيئة بعد المعالجة، تم اقتراح "الإدراك المتسلسل" (streaming perception) لتقييم زمن الاستجابة والدقة معًا في مقياس واحد لتحسين الإدراك عبر الفيديو في الزمن الفعلي. في هذه الورقة، بدلًا من البحث عن توازن بين الدقة والسرعة كما فعلت الدراسات السابقة، نشير إلى أن تمكين النماذج الزمنية الفعلية من التنبؤ بالمستقبل هو المفتاح لمعالجة هذه المشكلة. نُقدّم إطارًا بسيطًا وفعالًا للإدراك المتسلسل، يحتوي على وحدة إدراك ثنائية التدفق (DualFlow Perception - DFP) جديدة، تضم تدفقات ديناميكية وثابتة لالتقاط اتجاه الحركة والسمات الأساسية للكشف في التنبؤ المتسلسل. علاوةً على ذلك، نُقدّم دالة خسارة مُراعية للاتجاه (Trend-Aware Loss - TAL) تُدمج مع عامل اتجاه لتكوين أوزان تكيفية للأجسام ذات السرعات المختلفة في الحركة. تُظهر الطريقة البسيطة أداءً تنافسيًا على مجموعة بيانات Argoverse-HD، وتحسّن مؤشر الدقة (AP) بنسبة 4.9% مقارنة بنموذج أساس قوي، مما يؤكد فعاليتها. سيتم إتاحة الكود الخاص بنا عبر الرابط: https://github.com/yancie-yjr/StreamYOLO.