2ヶ月前

到着方向推定のための畳み込み再帰型ニューラルネットワークを用いた回帰と分類

Zhenyu Tang; John D. Kanu; Kevin Hogan; Dinesh Manocha
到着方向推定のための畳み込み再帰型ニューラルネットワークを用いた回帰と分類
要約

音源の到達方向(Direction-of-Arrival: DOA)を推定するための新しい学習ベースの手法について紹介します。この手法は、合成データとカルテジアンラベルを使用して回帰によって訓練された畳み込み再帰型ニューラルネットワーク(Convolutional Recurrent Neural Network: CRNN)を用いています。また、最新の音響伝搬アルゴリズムを用いて鏡面反射および拡散反射をモデル化することで、ニューラルネットワークの訓練に使用する合成データを生成する改良された方法も説明します。我々のモデルは、同じ問題に対する異なる表現で訓練された3つの他のCRNNと比較されます。具体的には、カテゴリラベルによる分類と球面座標ラベルによる回帰です。実際の評価では、我々のモデルは従来の手法よりも最大43%の角度誤差減少を達成しました。画像源法に基づく従来の手法と比較して、拡散反射を使用することでLOCATAデータセットでは34%、SOFAデータセットでは41%の角度予測誤差が減少しました。さらに、分類に基づくネットワークを使用する従来のスキームよりも3%の誤差減少が得られました。そして、我々のモデルはネットワークパラメータを36%削減しています。

到着方向推定のための畳み込み再帰型ニューラルネットワークを用いた回帰と分類 | 最新論文 | HyperAI超神経