Command Palette
Search for a command to run...
REFRAGデコードフレームワーク
REFRAGは、2025年9月にシンガポール国立大学およびライス大学と共同でMeta Superintelligence Labsによって提案されました。関連する研究結果は論文「REFRAG: RAGベースのデコードの再考”。
REFRAGは、圧縮、認識、拡張を通じて検索拡張生成(RAG)アプリケーションのレイテンシを改善する効率的なデコードフレームワークです。REFRAGは、デコードプロセスにいくつかの革新的な改良を導入しています。入力として検索された文章のトークンを使用する代わりに、事前に計算され圧縮されたセグメント埋め込みを近似表現として活用し、これらの埋め込みを直接デコーダーに入力します。その結果、REFRAGは計算負荷の高いトークン埋め込みへの依存を最小限に抑え、ほとんどのクエリブロックをRAG設定で圧縮できるようになります。