HyperAIHyperAI

Command Palette

Search for a command to run...

スター・トランスフォーマー

Author Name

概要

トランスフォーマーは多くの自然言語処理タスクで大きな成功を収めていますが、全結合の注意機構を持つ重い構造により、大量の学習データに依存しています。本論文では、慎重な疎化によって軽量な代替モデルであるスタートランスフォーマー(Star-Transformer)を提案します。モデルの複雑さを減らすために、全結合構造をスター形状のトポロジーに置き換えました。このトポロジーでは、すべての非隣接ノードが共有の中継ノードを通じて接続されています。これにより、複雑さは二次から一次に削減されつつ、局所的な合成と長距離依存関係を捕捉する能力が保たれます。4つのタスク(22のデータセット)における実験結果は、スタートランスフォーマーが標準的なトランスフォーマーよりも中規模のデータセットで有意な改善を達成したことを示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています