Command Palette

Search for a command to run...

12日前

YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

Mengqi Lei Siqi Li Yihong Wu Han Hu You Zhou Xinhu Zheng Guiguang Ding Shaoyi Du Zongze Wu Yue Gao

YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

要約

YOLOシリーズモデルは、優れた精度と計算効率の両方を備えているため、リアルタイム物体検出分野で圧倒的な地位を占めている。しかし、YOLO11以前のバージョンに代表される畳み込みアーキテクチャ、およびYOLOv12で導入された領域ベースの自己注意機構は、いずれも局所的な情報集約とペアワイズ相関モデリングに限定されており、グローバルな多対多の高次相関を捉える能力に欠けており、複雑なシナリオにおける検出性能に制限を受ける。本論文では、高精度かつ軽量な物体検出器であるYOLOv13を提案する。上記の課題に対処するため、ハイパーグラフに基づく適応的相関強化(Hypergraph-based Adaptive Correlation Enhancement, HyperACE)機構を提案する。この機構は、潜在的な高次相関を適応的に活用し、従来のハイパーグラフ計算に基づくペアワイズ相関モデリングに制限される問題を克服することで、効率的なグローバルなクロスロケーションおよびクロススケールの特徴融合と強化を実現する。さらに、HyperACEを基盤とした、フルパイプライン型の集約・分配(Full-Pipeline Aggregation-and-Distribution, FullPAD)パラダイムを提案する。このパラダイムにより、相関強化された特徴をネットワーク全体に分配することで、全ネットワークにわたり細粒度な情報フローと表現の協調を効果的に実現する。最後に、標準的な大カーネル畳み込みを深度方向可分畳み込み(depthwise separable convolutions)で置き換え、性能を損なわずにパラメータ数と計算量を大幅に削減するための複数のブロック構造を設計する。広く用いられるMS COCOベンチマーク上で大規模な実験を実施した結果、本手法はパラメータ数およびFLOPsが少ないにもかかわらず、最先端の性能を達成することが実証された。特に、YOLOv13-NはYOLO11-Nに対してmAPを3.0%、YOLOv12-Nに対して1.5%向上させた。

コードリポジトリ

wandahangfy/yolov11-rgbt
pytorch
GitHubで言及
imoonlab/yolov13
公式
pytorch
GitHubで言及

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出 | 論文 | HyperAI超神経