日付

2ヶ月前

組織

Paper URL

1b7whO4SfY

タグ

人工知能

ゲーテッド・アテンションは、2025年5月にアリババ・トンイ・チエンウェン・チームによって、エディンバラ大学、スタンフォード大学、その他の大学の研究チームと共同で提案されました。関連する研究成果は論文「大規模言語モデルのためのゲート付き注意：非線形性、スパース性、および注意シンクフリー」がNeurIPS 2025で最優秀論文賞を受賞しました。

研究チームは、大規模な実験（3.5兆トークンで学習した150億MoEモデルと17億の高密度モデル、30種類のバリエーション）を通じて、一連のゲーテッド・アテンション・バリアントを体系的に調査しました。この研究では、Scaled Dot Product Attention（SDPA）の後に特定ヘッドシグモイドゲーティングを適用することで、モデルのパフォーマンスを着実に向上できることが分かりました。この成果は、ゲーティングメカニズムが標準的なアテンション層におけるモデルのパフォーマンスと動作に与える影響を強調し、ゲーティングバリアントの評価を通じて、非線形性、スパース性、そしてアテンショントラップの排除を可能にする能力を明らかにしました。これらの知見は、ゲーテッドアテンションメカニズムに関する業界の理解を深めるものです。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

日付

2ヶ月前

組織

Paper URL

1b7whO4SfY

タグ

人工知能

レイアウト制御フレームワーク InstanceAssemble

InstanceAssemble は、マルチモーダル条件下で高品質かつ制御可能な画像生成を可能にします。

2ヶ月前

グループ分散戦略最適化 GVPO

GRPO などの既存の微調整手法の限界を考慮すると、GVPO は信頼性が高く多用途なトレーニング後のパラダイムとして登場しました。

3ヶ月前

判別制約最適化フレームワーク（DisCO）

新しい原理ベースの識別制約最適化フレームワークは、難易度バイアスとトレーニングの不安定性を回避します。

2ヶ月前

MultiPL-MoEアーキテクチャ（マルチプログラミング言語MoE）

MultiPL-MoEは、事前トレーニング後の段階で低ソースプログラミング言語を拡張するための効果的な方法です。

2ヶ月前

キャッシュツーキャッシュ（C2C）

C2C は、モデル間のキー値 (KV) キャッシュを変換および融合することで、直接的なセマンティック通信を可能にします。

2ヶ月前

推測する – 考える – 答える

GTA は、複数のテキスト分類ベンチマークにおいて、標準の SFT ベースラインや最先端の RL 方式を大幅に上回ります。

3ヶ月前

DexFlyWheelデータ生成フレームワーク

DexFlyWheel は、アジャイル操作のためのスケーラブルで自己改善的なデータ生成パラダイムです。

3ヶ月前

DiDi-Instruct 後トレーニング方法

分布マッチング蒸留を MDM ベースのテキスト生成に正常に適用した最初のフレームワークであり、数ステップの言語シーケンス生成の記録を樹立しました。

2ヶ月前

HiPOハイブリッド戦略最適化フレームワーク

HiPO は、主にハイブリッドデータ構築とハイブリッド強化学習を含む適応型 LLM 推論に使用されます。

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

ゲート付き注意

AIでAIを構築

HyperAI Newsletters

Command Palette

ゲート付き注意

関連 Wiki

レイアウト制御フレームワーク InstanceAssemble

グループ分散戦略最適化 GVPO

判別制約最適化フレームワーク（DisCO）

MultiPL-MoEアーキテクチャ（マルチプログラミング言語MoE）

キャッシュツーキャッシュ（C2C）

推測する – 考える – 答える

DexFlyWheelデータ生成フレームワーク

DiDi-Instruct 後トレーニング方法

HiPOハイブリッド戦略最適化フレームワーク

AIでAIを構築

HyperAI Newsletters

Command Palette

ゲート付き注意

関連 Wiki

レイアウト制御フレームワーク InstanceAssemble

グループ分散戦略最適化 GVPO

判別制約最適化フレームワーク（DisCO）

MultiPL-MoEアーキテクチャ（マルチプログラミング言語MoE）

キャッシュツーキャッシュ（C2C）

推測する – 考える – 答える

DexFlyWheelデータ生成フレームワーク

DiDi-Instruct 後トレーニング方法

HiPOハイブリッド戦略最適化フレームワーク

AIでAIを構築

HyperAI Newsletters

関連 Wiki

レイアウト制御フレームワーク InstanceAssemble

グループ分散戦略最適化 GVPO

判別制約最適化フレームワーク（DisCO）

MultiPL-MoEアーキテクチャ（マルチプログラミング言語MoE）

キャッシュツーキャッシュ（C2C）

推測する – 考える – 答える

DexFlyWheelデータ生成フレームワーク

DiDi-Instruct 後トレーニング方法

HiPOハイブリッド戦略最適化フレームワーク

関連 Wiki

レイアウト制御フレームワーク InstanceAssemble

グループ分散戦略最適化 GVPO

判別制約最適化フレームワーク（DisCO）

MultiPL-MoEアーキテクチャ（マルチプログラミング言語MoE）

キャッシュツーキャッシュ（C2C）

推測する – 考える – 答える

DexFlyWheelデータ生成フレームワーク

DiDi-Instruct 後トレーニング方法

HiPOハイブリッド戦略最適化フレームワーク