6日前

SearchInstruct:検索ベースの指示データセット作成によるドメイン適応の向上

Iman Barati, Mostafa Amiri, Heshaam Faili
SearchInstruct:検索ベースの指示データセット作成によるドメイン適応の向上
要約

教師あり微調整(SFT)は、大規模言語モデル(LLM)の学習において不可欠であり、指示従従性や文脈内学習といった重要な能力を顕著に向上させる。しかし、特定の分野に特化した適切な学習データセットを構築することは、分野固有の制約やデータの不足といった課題により、依然として困難である。本論文では、SFT向けに高品質な指示データセットを構築することを目的として、新しい手法「SearchInstruct」を提案する。本手法は、限定的な分野特化型の人工生成された質問から出発し、大規模言語モデルを用いて体系的に質問を拡張する。その後、各拡張された質問に対して、分野に関連するリソースを動的に検索し、正確かつ文脈的に適切な回答を生成する。実験的評価の結果、SearchInstructはSFTデータセットの多様性と品質の両方を向上させ、専門分野におけるLLM性能に有意な改善をもたらすことが示された。さらに、本手法はデータセット生成にとどまらず、モデル編集などのタスクにおいても効果的に活用できることを示した。これにより、既存モデルの効率的な更新が可能となる。再現性の確保およびコミュニティによる採用を促進するため、本研究では実装の詳細、生成されたすべての指示・応答ペア、およびソースコードを、公開可能なGitリポジトリに完全に提供している:https://github.com/mostafaamiri/SearchInstruct