Command Palette
Search for a command to run...
リソース効率的な画像分類のためのマルチスケール密度ネットワーク
リソース効率的な画像分類のためのマルチスケール密度ネットワーク
概要
本稿では、テスト時に計算リソースの制限がある状況における画像分類について検討する。このような状況には以下の2つの設定が含まれる:1. 任意時刻分類(anytime classification)— これは、テスト例に対するネットワークの予測を段階的に更新することで、任意のタイミングで予測結果を出力することを可能にする;2. バジェット付きバッチ分類(budgeted batch classification)— 一定の計算量のリソースが与えられ、そのリソースを「容易な」入力と「困難な」入力の間で不均等に配分して、複数の例を分類する。既存の多くの研究(例えば、広く知られるViola-Jonesアルゴリズムなど)とは異なり、本研究のアプローチは畳み込みニューラルネットワーク(CNN)に基づいている。我々は、異なるリソース消費量を持つ複数の分類器を事前に学習し、テスト時にその適応的な適用を行う。複数の分類器間で計算資源を最大限に再利用するため、それらを1つの深層CNNに「早期出力(early-exit)」として統合し、密接な相互接続構造(dense connectivity)で接続している。早期の段階から高品質な分類を実現するため、ネットワーク全体にわたり粗いレベルと細かいレベルの特徴を維持できる2次元マルチスケールネットワークアーキテクチャを採用している。3つの画像分類タスクにおける実験結果から、本フレームワークは両設定において、従来の最先端技術を顕著に上回ることを示した。