4ヶ月前

テンソル化ニューラルネットワーク

Alexander Novikov; Dmitry Podoprikhin; Anton Osokin; Dmitry Vetrov
テンソル化ニューラルネットワーク
要約

深層ニューラルネットワークは現在、いくつかの分野で最先端の性能を示しています。一方で、このクラスのモデルは計算リソースに対して非常に高負荷であり、特に一般的に使用される全結合層には大量のメモリが必要です。これにより、低スペックデバイスでのモデル利用が難しくなり、またモデルサイズのさらなる拡大が妨げられています。本論文では、全結合層の稠密な重み行列をテンソル列(Tensor Train)形式に変換することで、パラメータ数を大幅に削減しつつ、層の表現力を保つ方法を提案します。特に、Very Deep VGG ネットワークにおいては、全結合層の稠密な重み行列の圧縮率が最大20万倍となり、全体的なネットワークの圧縮率が最大7倍となることを報告しています。

テンソル化ニューラルネットワーク | 論文 | HyperAI超神経