HyperAIHyperAI

Command Palette

Search for a command to run...

MambaTalk: 選択的状態空間モデルを用いた効率的な包括的手勢合成

Zunnan Xu* Yukang Lin* Haonan Han* Sicheng Yang Ronghui Li Yachao Zhang† Xiu Li†

概要

ジェスチャ合成は、映画、ロボット工学、仮想現実などさまざまな分野で広範な応用を持つ人間とコンピュータの相互作用において重要な領域です。最近の進歩では、ジェスチャ合成を改善するために拡散モデルと注意機構が利用されています。しかし、これらの手法の高い計算複雑さにより、低遅延で長い多様なシーケンスを生成することは依然として課題となっています。本研究では、状態空間モデル(SSMs)の可能性を探り、離散運動事前分布を使用した二段階モデリング戦略を実装することでジェスチャの品質向上を目指します。基礎となるマンバブロックを活用し、多モーダル統合を通じてジェスチャの多様性とリズムを強化する「マンバトーク」を提案します。広範な実験結果から、当方法が最先端のモデルに匹敵または優れた性能を示すことが確認されました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています