HyperAIHyperAI

Command Palette

Search for a command to run...

FASTER: リアルタイムフロー VLAs の再考

Yuxiang Lu Zhe Liu Xianzhe Fan Zhenya Yang Jinghua Hou Junyi Li Kaixin Ding Hengshuang Zhao

概要

物理世界へのビジョン・言語・アクション(VLA)モデルの展開において、リアルタイム実行は極めて重要です。既存の非同期推論手法は主に軌道の滑らかさを最適化する一方で、環境変化への反応における重要な遅延(レイテンシ)を見落としています。本研究では、アクションチャンキングポリシーにおける「反応」の概念を再考し、反応時間を支配する要因を体系的に分析します。その結果、反応時間は「初回アクション到達時間(TTFA: Time to First Action)」と実行ホライズンによって共同で決定される一様分布に従うことを示します。さらに、フローベースのVLAにおける標準的な定数スケジューリングの適用は非効率であり、システムが移動を開始する前にすべてのサンプリングステップを完了することを強いるため、反応レイテンシのボトルネックを形成することを明らかにしました。この課題を克服するため、「即時反応のための高速アクションサンプリング(FASTER: Fast Action Sampling for ImmediaTE Reaction)」を提案します。ホライズン認識型スケジューラ(Horizon-Aware Schedule)を導入することで、FASTERはフローサンプリング中に近未来のアクションを適応的に優先し、即時反応のノイズ除去を10倍圧縮(例:π_{0.5}およびX-VLAにおいて単一ステップへ)しつつ、長期的な軌道の品質を維持します。さらに、ストリーミング型クライアント・サーバーパイプラインと組み合わせることで、FASTERは実ロボットにおける実効反応レイテンシを大幅に低減し、特にコンシューマーグレードのGPU上で展開された場合に顕著な効果を発揮します。高速な卓球タスクを含む実世界実験により、FASTERが汎用ポリシーに前例のないリアルタイム応答性を付与し、正確かつ滑らかな軌道の迅速な生成を可能にすることが実証されました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています