17日前

アンシャープマスキング層:畳み込みネットワークにおける事前知識の導入による画像分類

{Jordina Torrents-Barrena, Michael Granados-Menani, Adán Mora-Fallas, Saul Calderon-Ramirez, Jose Carranza-Rojas}
要約

画像強調(Image enhancement)とは、エッジ、境界線、コントラストなどの特定の画像特徴を強化するプロセスを指す。その主な目的は、元の画像を処理することで、視覚化、分類、セグメンテーションといったタスク全体の性能を著しく向上させることにある。従来の手法では、強調の挙動を制御するためのパラメータ調整に手動による微調整が必要であった。近年では、畳み込みニューラルネットワーク(CNN)のアプローチにおいて、上記の技術が強化された前処理ステップとして頻繁に用いられている。本研究では、広く知られる「アンシャープマスキング(unsharp masking)」アルゴリズムに基づく、初めての内在的(intrinsic)CNN前処理層を提案する。本提案層は、入力画像に高周波成分を加えることで、画像の意味のある特徴を強調するための事前知識を組み込む。この層はモデル学習中にアンシャープマスキングのパラメータを自動最適化し、手動による介入を一切不要とする。本手法の性能と影響を、CIFAR100画像分類およびPlantCLEF識別チャレンジの2つの応用事例において評価した。その結果、既存の代表的なCNNモデルに対して顕著な性能向上が得られ、PlantCLEFでは2.42%、汎用的なCIFAR100では9.49%の精度向上が達成された。アンシャープ強調層の設計は、シンプルなCNNモデルにおいても、わずかな性能コストで精度を明確に向上させることを示しており、事前知識を直接注入することでモデルのロバスト性が向上することが明らかになった。

アンシャープマスキング層:畳み込みネットワークにおける事前知識の導入による画像分類 | 最新論文 | HyperAI超神経