日付

2年前

KV キャッシュの正式名は Key-value Cache で、大規模なモデルの推論パフォーマンスを最適化するための一般的なテクノロジです。このテクノロジは、計算精度に影響を与えることなく、空間を時間に交換するというアイデアによって推論パフォーマンスを向上させることができます。 KV キャッシュは、Transformer の推論パフォーマンスを最適化するための重要なエンジニアリングテクノロジです。すべての主要な推論フレームワークが実装およびカプセル化されており (たとえば、トランスフォーマーライブラリの生成関数がカプセル化しているため、ユーザーが past_key_values を手動で渡す必要がありません)、デフォルトで有効になっています (config.json ファイルで use_cache=True)。）。

参考文献

【1】https://zhuanlan.zhihu.com/p/630832593

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

日付

2年前

参考文献

【1】https://zhuanlan.zhihu.com/p/630832593

ピークリターン貪欲スライス

PRGSは、オフライン強化学習モデルが高報酬の経験を繋ぎ合わせる能力を大幅に向上させる。

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

KVキャッシュ

参考文献

AIでAIを構築

HyperAI Newsletters

Command Palette

KVキャッシュ

参考文献

ピークリターン貪欲スライス

AIでAIを構築

HyperAI Newsletters

Command Palette

KVキャッシュ

参考文献

ピークリターン貪欲スライス

AIでAIを構築

HyperAI Newsletters

ピークリターン貪欲スライス

ピークリターン貪欲スライス