2ヶ月前

解釈可能なSincNetを用いた畳み込みフィルター

Mirco Ravanelli; Yoshua Bengio
解釈可能なSincNetを用いた畳み込みフィルター
要約

深層学習は現在、より高度な人工知能の実現に重要な役割を果たしています。このパラダイムにより、ニューラルネットワークは単純なものから段階的に組み合わせることで複雑かつ抽象的な表現を学習することが可能となります。しかし、現代のニューラルアーキテクチャが自動的に発見する内部の「ブラックボックス」表現は、解釈可能性に欠けることがしばしばあり、説明可能な機械学習技術の研究が主要な関心事となっています。本論文では、生波形から直接音声を処理するためのより解釈可能なニューラルモデルを開発した最近の取り組みを要約します。特に、パラメトリックなsinc関数を利用することで最初の層がより意味のあるフィルターを発見しやすくする新しい畳み込みニューラルネットワーク(CNN)であるSincNetを提案します。標準的なCNNとは異なり、各フィルターのすべての要素を学習するのではなく、帯域通過フィルターの低周波数と高周波数カットオフだけがデータから直接学習されます。この帰納的バイアスは、物理的な意味を持ついくつかのパラメータのみに依存するカスタマイズされたフィルタバンクフロントエンドを非常にコンパクトに導き出す方法を提供します。我々が行った話者認識と音声認識に関する実験では、提案されたアーキテクチャが標準的なCNNよりも早く収束し、性能も高く、解釈可能性も優れていることが示されました。

解釈可能なSincNetを用いた畳み込みフィルター | 最新論文 | HyperAI超神経