2ヶ月前

量子化された密結合U-Netを用いた効率的なランドマーク局所化

Zhiqiang Tang; Xi Peng; Shijie Geng; Lingfei Wu; Shaoting Zhang; Dimitris Metaxas
量子化された密結合U-Netを用いた効率的なランドマーク局所化
要約

本論文では、効率的な視覚ランドマークの位置特定のために量子化された密結合U-Netを提案します。このアイデアは、同じ意味を持つ特徴量がスタックされたU-Net間でグローバルに再利用されることです。このような密結合により情報の流れが大幅に改善され、位置特定の精度が向上します。しかし、単純な密結合設計では訓練およびテストにおいて重大な効率性の問題が発生します。この問題を解決するために、まずK次の密結合(order-K dense connectivity)を提案し、長距離ショートカットを削除します。次に、メモリ効率の高い実装手法を使用して訓練効率を大幅に向上させるとともに、モデルサイズを半分にする可能性のある反復改良手法について調査しました。最後に、訓練およびテストにおけるメモリ消費と高精度演算を削減するため、位置特定ネットワークの重み、入力、勾配を低ビット幅の数値に量子化しました。我々はこの手法を2つのタスクで検証しました:ヒューマンポーズ推定と顔合わせ(face alignment)。結果は、我々の手法が他の基準となる位置特定器と比較して最高峰の位置特定精度を達成しながら、約70%少ないパラメータ数、約98%少ないモデルサイズ、そして約75%の訓練メモリ節約という優れた性能を示しています。コードはhttps://github.com/zhiqiangdon/CU-Net で公開されています。