HyperAIHyperAI

Command Palette

Search for a command to run...

Console

フラッシュモバ

日付

4日前

組織

マサチューセッツ工科大学
エヌビディア

論文URL

2511.11571

FlashMoBAは2025年11月にMITとNvidiaの研究チームによって共同で提案され、関連する研究成果が論文として発表されました。 ブロックアテンションの混合の最適化

FlashMoBAは、理論上推奨される小さなブロックサイズでも効率的なMoBA実行を可能にする、ハードウェアを考慮したCUDAカーネルです。FlashAttentionの技術を借用し、ブロックスパース性に対する新たな最適化を追加することで、このパラダイムはFlashAttention-2と比較して14.7倍の高速化を実現し、これまで非現実的であった理論上最適な構成の導入を可能にします。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています