LangChain 기반 Shandu, 검색 2.0 시대 개막
산두(Shandu)는 LangChain을 기반으로 구축된 강력한 오픈 소스 AI 연구 도구로, 지식의 발견과 종합 과정을 간소화합니다. 산두는 오픈AI의 DeepResearch와 같은 독점 시스템의 혁신적인 대안으로, LangChain과 LangGraph를 활용해 자동화된 다중 출처 연구를 수행할 수 있습니다. 이 글에서는 산두의 LangChain 기반, 다른 LangChain 기반 도구들과의 위치, 그리고 전통적인 검색 방식(Search 1.0)에서 새로운 AI 구동 검색 방식(Search 2.0)으로의 전환을 살펴보겠습니다. 산두의 LangChain 기반 LangChain은 LLM(대형 언어 모델)-구동 애플리케이션을 개발하기 위한 프레임워크이며, LangGraph는 상태 관리를 위한 워크플로우를 생성하는 라이브러리입니다. 산두는 이 두 기술을 통해 쿼리 명확화부터 구조화된 마크다운 보고서를 생성하는 전 과정을 자동화합니다. 보고서에는 완전한 인용 문헌이 포함되어 있어 사용자가 신뢰할 수 있는 정보를 쉽게 얻을 수 있습니다. 주요 LangChain 기반 도구들 산두 외에도 LangChain을 활용한 다양한 도구들이 확장되고 있습니다. 여기서는 5가지 주목할 만한 예들을 소개합니다: Quivr: LangChain을 이용해 문서를 처리하고 RAG(Retrieve, Augment, Generate) 기능을 제공하는 오픈 소스 '두 번째 뇌' 도구입니다. LangFlow: LangChain 컴포넌트를 시각적으로 생성하고 실험할 수 있는 UI입니다. Flowise: LangChain 워크플로우를 생성하기 위한 드래그앤드롭 UI 빌더입니다. Langroid: LangChain 위에 구축된 다중 에이전트 협업 프레임워크입니다. Camel: LangChain을 활용해 에이전트 기능을 제공하는 커뮤니케이션 에이전트 프레임워크입니다. 또한, ChatDev, Chainlit, GPTRouter, BentoML, PrivateGPT, Auto-GPT 등도 LangChain을 활용하거나 강력한 통합을 제공하여 다양한 용도로 사용됩니다. LangChain의 플라이휠 효과 LangChain은 통합된 LLM 오케스트레이션 프레임워크를 제공함으로써 다른 기술들의 가속화 역할을 합니다. 모듈화된 컴포넌트인 체인, 에이전트 등은 빠른 프로토타이핑과 반복을 가능하게 하며, 외부 API와 데이터 소스와의 통합은 기능을 더욱 향상시킵니다. 오픈 소스 커뮤니티의 지속적인 개선 노력 덕분에 이러한 플라이휠 효과는 혁신을 증폭시키며, 산두와 같은 도구를 더욱 강력하고 접근하기 쉽게 만들어줍니다. Search 1.0에서 Search 2.0으로의 진화 Search 1.0 시대에는 사용자들이 스폰서 링크, SEO 최적화 노이즈, 그리고 관련성 없는 결과물에 직면했습니다. 답변을 찾기 위해서는 여러 페이지를 넘겨보고, 여러 탭을 열어, 분산된 출처를 읽고, 수동으로 정보를 종합해야 하는 시간과 노력을 많이 들였습니다. 이러한 과정은 시간 소모적이며 실수를 유발하기 쉬웠습니다. Search 2.0은 이러한 경험을 완전히 바꾸어 놓습니다. 산두와 같은 도구들은 원시 검색 결과 대신 데이터를 검색, 종합, 포맷하여 사용자가 소비할 수 있는 형태로 제공합니다. 예를 들어, shandu research "양자 컴퓨팅과 기후 모델링" --depth 3 --output report.md라는 명령어를 사용하면 몇 분 만에 광범위한 출처를 종합한 구조화된 보고서를 생성할 수 있습니다. 이는 전통적인 검색 과정에서의 수작업을 대체하며, 정보 접근성을 획기적으로 높여줍니다. 이러한 변화는 연구를 민주화시키고, 더 빠르고 쉽게 정보를 얻을 수 있도록 합니다. 그러나 Search 2.0 도구들이 완전한 잠재력을 발휘하려면 LLM의 편향성, 출처 신뢰성, 확장성 등의 문제를 해결해야 합니다. 산업 전문가 평가 및 회사 프로필 산두는 오픈 소스 커뮤니티의 활발한 참여를 통해 빠르게 성장하고 있으며, AI 연구 도구로서의 잠재력을 인정받고 있습니다. 전문가들은 산두가 전통적인 검색 방법에서 벗어나 AI 기술을 활용한 효율적인 정보 처리 능력을 갖췄다고 평가하며, 이를 통해 연구의 질을 크게 향상시킬 수 있다고 봅니다. 하지만 여전히 해결해야 할 문제들이 있다는 점도 지적되었습니다. 특히, LLM의 편향성과 출처의 신뢰성을 확보하는 것이 중요한 과제로 언급되었습니다. 산두는 이러한 문제들을 해결하기 위해 계속해서 개선되고 있으며, 앞으로 더 많은 기능과 향상된 사용자 경험을 제공할 것으로 기대됩니다.