15日前

多項式ニューラルネットワークを用いたディープ分類器の拡張

Grigorios G Chrysos, Markos Georgopoulos, Jiankang Deng, Jean Kossaifi, Yannis Panagakis, Anima Anandkumar
多項式ニューラルネットワークを用いたディープ分類器の拡張
要約

深層ニューラルネットワークは、物体認識や音声認識など分類タスクにおける成功を牽引してきました。近年提案された多様なアーキテクチャにより、驚異的な性能と汎化能力が達成されていますが、その多くは表面上は関連性のないものに見えるのが特徴です。本研究では、深層分類器の研究を統一的な枠組みの下で再構成します。具体的には、最先端のアーキテクチャ(例:残差ネットワークや非局所ネットワーク)を入力の異なる次数の多項式として表現します。この枠組みにより、各モデルが持つ帰納的バイアス(inductive biases)についての洞察が得られるとともに、その多項式構造に基づく自然な拡張が可能になります。提案するモデルの有効性は、標準的な画像および音声分類ベンチマーク上で評価されています。さらに、モデルの表現力は、性能向上およびモデル圧縮の両面から顕著に示されています。また、本分類体系によって可能となる拡張は、データ量が限られている場合や長尾分布(long-tailed distribution)を示すデータセットにおいても、明確な利点を示しています。本分類体系が、既存の分野特化型アーキテクチャ間のつながりを提供することを期待しています。ソースコードは以下のURLで公開されています:\url{https://github.com/grigorisg9gr/polynomials-for-augmenting-NNs}。

多項式ニューラルネットワークを用いたディープ分類器の拡張 | 最新論文 | HyperAI超神経