2ヶ月前
制約付きR-CNN: 一般的な画像操作検出モデル
Yang, Chao ; Li, Huizhou ; Lin, Fangting ; Jiang, Bin ; Zhao, Hao

要約
最近、深層学習を基盤とするモデルは、画像操作検出において優れた性能を示しています。しかし、これらのモデルの多くは、手作業で生成されたまたは事前に決定された特徴量の汎用性が低く、問題を抱えています。また、操作の位置特定にのみ焦点を当てており、操作の分類には十分な注意が払われていません。これらの課題に対処するため、私たちは完全かつ正確な画像鑑別を行うための「粗から細へ」のアーキテクチャである制約付きR-CNN(Constrained R-CNN)を提案します。まず、学習可能な操作特徴抽出器はデータから直接統一的な特徴表現を学習します。次に、注意領域提案ネットワークは効果的に操作領域を識別し、次の操作分類と粗い位置特定のために使用されます。その後、スキップ構造は低レベル情報と高レベル情報を融合して全体的な操作特徴を洗練します。最後に、粗い位置特定情報がモデルに導きを与え、より詳細な局所特徴をさらに学習し、改ざんされた領域をセグメンテーションします。実験結果は、私たちのモデルが最先端の性能を達成していることを示しています。特に、NIST16、COVERAGE、ColumbiaデータセットにおいてF1スコアがそれぞれ28.4%、73.2%、13.3%向上しました。