
要約
コンピュータビジョンのタスクにおいて、代表的な課題の一つは、画像の視覚的多様性に起因するものである。この多様性は、学習された知識と現在の観測値が示す視覚的コンテンツとの間に一致(同意)または不一致(相違)を引き起こす可能性がある。本研究では、まず概念学習プロセスにおけるこのような一致を「整合性(congruency)」と定義する。形式的には、特定のタスクと十分に大きなデータセットが与えられた状況下で、学習プロセスにおいて訓練データ内のタスク固有の意味情報が著しく変動する場合に、整合性の問題が生じる。本研究では、この整合性を向上させるため、方向集中学習(Direction Concentration Learning: DCL)という手法を提案する。この手法により、学習過程における整合性が向上し、収束経路がより直線的かつ効率的になることが示された。実験結果から、提案手法DCLは最先端のモデルや最適化手法にも汎化可能であり、注目度予測タスク、継続的学習タスク、分類タスクの性能を向上させることを確認した。さらに、継続的学習タスクにおける「災害的忘却(catastrophic forgetting)」問題の緩和にも寄与することが明らかになった。本手法の実装コードは、GitHubにて公開されている:https://github.com/luoyan407/congruency。