HyperAIHyperAI

Command Palette

Search for a command to run...

REFRAGデコードフレームワーク

Date

4ヶ月前

Organization

シンガポール国立大学

Paper URL

2509.01092

REFRAGは、2025年9月にシンガポール国立大学およびライス大学と共同でMeta Superintelligence Labsによって提案されました。関連する研究結果は論文「REFRAG: RAGベースのデコードの再考”。

REFRAGは、圧縮、認識、拡張を通じて検索拡張生成(RAG)アプリケーションのレイテンシを改善する効率的なデコードフレームワークです。REFRAGは、デコードプロセスにいくつかの革新的な改良を導入しています。入力として検索された文章のトークンを使用する代わりに、事前に計算され圧縮されたセグメント埋め込みを近似表現として活用し、これらの埋め込みを直接デコーダーに入力します。その結果、REFRAGは計算負荷の高いトークン埋め込みへの依存を最小限に抑え、ほとんどのクエリブロックをRAG設定で圧縮できるようになります。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています