Command Palette
Search for a command to run...
{Chu-Song Chen Cheng-En Wu Cheng-Hao Tu}

要約
近年の深層学習研究において、モデルの予測精度を向上させるために条件付き操作(conditional operations)が注目されている。この分野における最近の進展として、条件付きパラメトリック畳み込み(CondConv)が提案された。CondConvは、深層モデルの重みによって提供される追加の表現能力を活用することで性能を向上させる一方で、モデルの計算複雑度はほとんど増加しないという特長を持つ。CondConvは入力に依存する融合パラメータを用い、複数の畳み込みカーネル列を適応的に組み合わせることで性能を向上させる。実行時において、カーネル列はオンラインで一つのカーネルに統合されるため、同じ表現能力を有する場合、従来の複数列を用いた畳み込み層と比較して時間計算量が大幅に削減される。確かにCondConvは深層モデルの性能向上に有効であるが、現状では単一のタスクにのみ適用されている。その計算効率を保ちつつモデル重みを追加できるという優れた特性を活かし、本研究ではタスクが順次提示される連続的(sequential)多タスク学習にCondConvを拡張した。本研究では、CondConv構造に基づく順次多タスク学習アプローチ「CondConv-Continual」を提案する。実験結果から、提案手法が忘却のない連続学習(unforgetting continual learning)において有効であることが示された。既存の手法と比較して、CondConvは神経ネットワークを追加の表現能力を得るために拡張するための規則的かつ実装が容易な方法を提供するとともに、異なるタスクモデル間で相互参照(cross-referencing)を可能にするメカニズムを備えており、比較的安定した性能を実現できる。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| continual-learning-on-cifar100-20-tasks | CPG-light | Average Accuracy: 77.0 |
| continual-learning-on-cifar100-20-tasks | CondConvContinual | Average Accuracy: 77.4 |
| continual-learning-on-cubs-fine-grained-6 | CondConvContinual | Accuracy: 84.26 |
| continual-learning-on-flowers-fine-grained-6 | CondConvContinual | Accuracy: 97.16 |
| continual-learning-on-imagenet-50-5-tasks | CondConvContinual | Accuracy: 61.32 |
| continual-learning-on-imagenet-fine-grained-6 | CondConvContinual | Accuracy: 76.16 |
| continual-learning-on-sketch-fine-grained-6 | CondConvContinual | Accuracy: 80.77 |
| continual-learning-on-stanford-cars-fine | CondConvContinual | Accuracy: 92.61 |
| continual-learning-on-wikiart-fine-grained-6 | CondConvContinual | Accuracy: 78.32 |