2ヶ月前

YOLOv11: 主要なアーキテクチャの改善点の概要

Rahima Khanam; Muhammad Hussain
YOLOv11: 主要なアーキテクチャの改善点の概要
要約

本研究は、YOLO(You Only Look Once)シリーズの最新版であるYOLOv11のアーキテクチャ解析を提示します。モデルのアーキテクチャ上の革新点、C3k2(クロスステージ部分ブロック カーネルサイズ2)、SPPF(空間ピラミッドプーリング - ファスト)、およびC2PSA(並列空間注意付き畳み込みブロック)コンポーネントの導入について検討し、これらの要素が特徴抽出の向上など、モデルの性能を多面的に改善する貢献について述べています。本論文では、YOLOv11が物体検出、インスタンスセグメンテーション、姿勢推定、および向き付き物体検出(OBB)などの様々なコンピュータビジョンタスクにおける拡大した能力を探ります。また、先行モデルと比較して平均精度(mAP)と計算効率の向上についてレビューし、パラメータ数と精度のトレードオフに焦点を当てています。さらに、本研究ではYOLOv11がnanoからextra-largeまで異なるモデルサイズにおいても汎用性を持つことについて議論しており、エッジデバイスから高性能コンピューティング環境まで多様なアプリケーションニーズに対応しています。当研究はYOLOv11が物体検出分野全体の中で占める位置づけやリアルタイムコンピュータビジョンアプリケーションへの潜在的な影響について洞察を提供します。

YOLOv11: 主要なアーキテクチャの改善点の概要 | 最新論文 | HyperAI超神経