7日前
RF-Next:畳み込みニューラルネットワークにおける効率的な受容 field 探索
Shanghua Gao, Zhong-Yu Li, Qi Han, Ming-Ming Cheng, Liang Wang

要約
モデルの時間的/空間的受容野(receptive fields)は、時系列的/空間的タスクにおいて重要な役割を果たす。広い受容野は長期的な関係を捉えるのに有効である一方、狭い受容野は局所的な詳細を捉えるのに有利である。従来の手法では、層ごとに手動で設計された受容野構造をモデルに組み込んできた。では、手動で設計されたパターンに代わって、効果的に受容野の組み合わせを探索することは可能だろうか?この問いに答えるため、本研究ではグローバルからローカルへと段階的に探索する戦略を用いて、より優れた受容野の組み合わせを探索する手法を提案する。本手法は、まずグローバル探索によって人間が設計したパターンにとらわれない粗い組み合わせを発見し、その上に、期待値をガイドとして用いた反復的ローカル探索スキームを導入することで、より精密な受容野の組み合わせを効果的に精緻化する。本研究で提案するRF-Nextモデルは、さまざまなモデルに受容野探索機構を統合することで、時系列行動分割、物体検出、インスタンスセグメンテーション、音声合成など、多数のタスクにおいて性能向上を実現した。実装コードは公開されており、http://mmcheng.net/rfnext にて入手可能である。