AI研究エージェントの文脈不足を解消する「DeepRishSearch」が公開——持続可能な開発目標(SDGs)に基づく深層リサーチを実現
AI研究エージェントの開発において「文脈のギャップ」を埋めることが重要な課題である。米国で開発された「DeepRishSearch」というReAct型AIエージェントは、国連持続可能な開発目標(SDGs)に基づくデータを活用し、国別に持続可能な開発の進捗を分析するプロトタイプとして注目されている。このエージェントは、ユーザーの質問を段階的に分解し、キーワード抽出から研究課題の生成、実際のデータ収集、合成、評価までを自動化する仕組みを持つ。中心となるのは、小規模な言語モデル(GPT-4o-mini)とRetrieval-Augmented Generation(RAG)技術の組み合わせで、外部データソースからリアルタイムで情報を収集・統合する能力だ。 エージェントのワークフローは「議論会議」にたとえられる。まず「モデレーター」がユーザーの入力を明確にし、SDGの17項目のうち関連するテーマをDistilBERTモデルで分類。次に「専門家パネル」が複数のツール(Semantic Scholar、Tavily、Our World in Dataなど)を活用し、学術論文、最新ニュース、統計データを収集。最後に「議事録作成者」が情報を要約し、統合的なレポートを生成する。このプロセスにより、単なるキーワード検索を超えた深層的な分析が可能になる。 特に注目すべきは、AIが持つ「文脈の制限」への対応だ。人間は生涯の経験に基づいて推論できるが、AIは提示された瞬間の情報に限定される。このギャップを埋めるために、エージェントは「フィードバックループ」を構築。専門家の評価結果をベクトルデータベースに蓄積し、AIの出力精度を70〜80%から90%以上に向上させる仕組みを採用。実証実験では、インドネシアの「飢餓撲滅(SDG2)」に関する分析において、Gemini 2.5 Proと比較して、より現実的で慎重な評価(4/10)を示した。 このプロジェクトは、AIが人間の専門知識を補完するツールとしての役割を明確にしている。開発者は、AIによる自動生成に依存するのではなく、人間が問題の定義と評価の最終判断を行う必要があると強調。現在はStreamlitで公開されたデモアプリとして利用可能で、GPTやGemini、TavilyのAPIキーを用いて実行できる。今後の展開として、複数のエージェントによる協調作業や、リアルタイムの学習・バイアス監視システムの構築が期待されている。AIは「人間の知性を補助する装置」であり、その限界を理解した上で、より正確かつ信頼性の高い研究支援を実現する可能性を秘めている。