HyperAIHyperAI

Command Palette

Search for a command to run...

トレーナブルな表現プーリングを用いたTransformerモデルのスパース化

Anonymous

概要

我々は、Transformerモデルにおけるアテンションの疎化を、学習過程において最も情報量の多いトークン表現を選択する新たな手法により実現する。これにより、入力データのタスク固有の部分に注目することができる。堅牢なトレーナブルなtop-kkk演算子の導入により、時間およびメモリ複雑度を二次関数的から部分線形にまで削減した。困難な長文要約タスクにおける実験結果から、単純なベースラインでも現在の最先端(SOTA)と同等の性能を達成でき、トレーナブルなプーリングを導入することでその高い品質を維持しつつ、学習時には1.8倍、推論時には4.5倍高速化され、デコーダーにおける計算効率は最大で13倍向上することが明らかになった。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
トレーナブルな表現プーリングを用いたTransformerモデルのスパース化 | 記事 | HyperAI超神経