17日前
KerCNNs:汚損画像の分類に向けた生物学的にインスパイアされた側方結合
Noemi Montobbio, Laurent Bonnasse-Gahot, Giovanna Citti, Alessandro Sarti

要約
多くのコンピュータビジョンタスクにおける最先端技術は、畳み込みニューラルネットワーク(CNN)によって代表されている。CNNの階層的構造と局所的特徴抽出は、霊長類の視覚系の構造に着想を得ているものの、そのアーキテクチャには横方向の結合が欠如しているため、生物学的オブジェクト処理との分析において重要な違いが生じている。近年、幾何学的制約のない学習可能な再帰的カーネルとして、畳み込み型の再帰的横方向結合をCNNに導入する試みが実現されている。本研究では、CNNの前向きフィルタ間の相関関係を表現する生物学的に現実的な横方向カーネルを導入する。各層において、対応するカーネルは活性化値の空間における遷移カーネルとして機能する。これらの横方向カーネルは、前向きフィルタの構造に基づいて定義されるため、前向き構造に依存した幾何学的構造をパラメータフリーで評価するアプローチを提供する。次に、この新アーキテクチャ(KerCNN)を、グローバル形状解析およびパターン補完に関連する一般化タスクに対して評価した。ネットワークは基本的な画像分類の学習を経た後、劣化したテスト画像に対する評価が行われた。検証された画像の摂動は、局所的特徴による認識を妨げる設計となっており、文脈情報の統合を必要とする。生物学的視覚において、このような文脈統合は横方向結合と密接に関連している。実験の結果、KerCNNは従来のCNNおよび再帰的CNNと比べて、このような劣化に対してはるかに高い安定性を示した。これにより、挑戦的な条件下でのオブジェクト認識を強化するという、生物学的インスピレーションに基づくアプローチの有効性が裏付けられた。