17日前
YOLO-Former:YOLOがViTと手を握る
Javad Khoramdel, Ahmad Moori, Yasamin Borhani, Armin Ghanbarzadeh, Esmaeil Najafi

要約
提案されたYOLO-Former手法は、TransformerとYOLOv4の概念をスムーズに統合することで、高い精度と効率性を兼ね備えた物体検出システムを構築した。本手法はYOLOv4の高速な推論速度を活かしつつ、畳み込み注意(convolutional attention)モジュールとTransformerモジュールを統合することで、Transformerアーキテクチャの利点を効果的に取り入れている。実験結果から、提案手法の有効性が示された。Pascal VOCデータセットにおいて、平均精度(mAP)は85.76%を達成し、同時に10.85フレーム/秒という高い予測速度を維持した。本研究の貢献は、最新の2つの技術を革新的に組み合わせることで、物体検出分野におけるさらなる性能向上が可能であることを示したことにある。