HyperAIHyperAI
منذ 17 أيام

Stripformer: Strip Transformer لتفريغ الصور بسرعة

Fu-Jen Tsai, Yan-Tsung Peng, Yen-Yu Lin, Chung-Chi Tsai, Chia-Wen Lin
Stripformer: Strip Transformer لتفريغ الصور بسرعة
الملخص

يمكن أن تحتوي الصور المُلتَقَطة في مشاهد ديناميكية على ضبابية حركية غير مرغوب فيها، والتي تُعدّ سببًا رئيسيًا في تدهور الجودة البصرية. تؤدي هذه الضبابية إلى ظهور تشوهات تمويهية محددة مناطقية على المدى القصير والطويل، غالبًا ما تكون اتجاهية وغير متجانسة، ما يجعل إزالتها أمرًا صعبًا. مستلهمين من النجاح الحالي للنماذج القائمة على المُحَوِّلات (Transformers) في مهام الرؤية الحاسوبية ومعالجة الصور، نطور نموذج Stripformer، وهو معمارية قائمة على المُحَوِّلات تُنشئ رموزًا داخل الشريط (intra-strip tokens) وخارج الشريط (inter-strip tokens) لإعادة وزن ميزات الصورة في الاتجاهات الأفقية والرأسية، بهدف اكتشاف أنماط الضبابية ذات الاتجاهات المختلفة. كما يعتمد النموذج على تجميع طبقات انتباه متناوبة داخل الشريط وخارج الشريط، مما يُمكّن من الكشف عن كميات الضبابية. علاوةً على اكتشاف أنماط الضبابية المحددة مناطقية وذات اتجاهات ومقادير مختلفة، يُعدّ Stripformer أيضًا نموذج مُحَوِّلًا فعّالًا من حيث عدد الرموز (token-efficient) وفعّالًا من حيث عدد المعاملات (parameter-efficient)، حيث يُطلِب استخدامًا أقل بكثير من الذاكرة والتكلفة الحسابية مقارنةً بالنموذج الأساسي (vanilla transformer)، مع أداء أفضل دون الاعتماد على كميات هائلة من البيانات التدريبية. أظهرت النتائج التجريبية أن Stripformer يتفوّق على النماذج الرائدة في مجال إزالة الضبابية من المشاهد الديناميكية.

Stripformer: Strip Transformer لتفريغ الصور بسرعة | أحدث الأوراق البحثية | HyperAI