Command Palette
Search for a command to run...
デンス・レトリバー
Dense Retrieverは、新しい自己教師あり学習フレームワークであるRevelaの中核となる最適化コンポーネントです。このフレームワークは、ダルムシュタット工科大学、ワシントン大学、カーネギーメロン大学、マイクロソフト、およびテンセントAIラボの共同チームによって提案され、関連する研究成果は論文として発表されています。 Revela: 言語モデリングによる高密度リトリーバー学習ICLR 2026に採択されました。
高密度検索エンジンのコアメカニズムは、クエリとドキュメントを高次元ベクトル空間にマッピングし、ベクトル類似度を計算することでコンテンツの関連性を判断し、それによって言語モデルが外部の専門知識を獲得できるようにすることです。従来、高品質の高密度検索エンジンのトレーニングは、コストのかかる手動でラベル付けされたクエリとドキュメントのデータに大きく依存していたため、コーディングなどの複雑な専門分野で大規模に適用することは困難でした。最新のRevelaの研究では、高密度検索エンジンはこのボトルネックを完全に克服しました。言語モデルの「次の単語を予測する」タスクに巧妙に統合され、クロスドキュメントアテンションメカニズムを導入することで共同で最適化されています。実験では、ラベル付きデータなしでトレーニングされたこの高密度検索エンジンが、特定のドメインや複雑な推論タスクにおいて、より大きなパラメータサイズを持つ教師ありモデルを上回るだけでなく、極めて低いデータおよび計算コストで、一般的なドメインにおいても最先端(SOTA)のパフォーマンスを達成することが示されています。