Command Palette

Search for a command to run...

14일 전

DeepAnalyze: 자율 데이터 과학을 위한 에이전트형 대규모 언어 모델

Shaolei Zhang Ju Fan Meihao Fan Guoliang Li Xiaoyong Du

DeepAnalyze: 자율 데이터 과학을 위한 에이전트형 대규모 언어 모델

초록

원시 데이터 소스에서 분석가 수준의 심층 연구 보고서에 이르기까지 자율적인 데이터 과학을 구현하는 것은 오랜 기간 동안 도전 과제였으나, 강력한 대규모 언어 모델(LLM)의 등장으로 이제 실현 가능해지고 있다. 최근의 워크플로우 기반 데이터 에이전트는 특정 데이터 작업에서 희망적인 성과를 보여주고 있으나, 사전 정의된 워크플로우에 의존하는 한계로 인해 완전한 자율 데이터 과학을 달성하는 데는 여전히 한계가 있다. 본 논문에서는, 데이터 소스에서부터 분석가 수준의 심층 연구 보고서에 이르는 엔드투엔드 파이프라인을 자동으로 완수할 수 있는, 자율 데이터 과학을 위한 첫 번째 에이전트형 LLM인 DeepAnalyze-8B를 제안한다. 고도로 복잡한 데이터 과학 작업을 해결하기 위해, 인간 데이터 과학자의 학습 과정을 모방하는 커리큘럼 기반의 에이전트 훈련 패러다임을 제안한다. 이는 LLM이 현실 환경에서 점진적으로 다양한 능력을 습득하고 통합할 수 있도록 한다. 또한, 고품질의 훈련 데이터를 생성하기 위한 데이터 기반 궤적 합성 프레임워크를 도입한다. 에이전트 기반 훈련을 통해 DeepAnalyze는 데이터 질문 응답, 전문적 분석 작업, 개방형 데이터 연구에 이르는 광범위한 데이터 작업을 수행하는 능력을 습득한다. 실험 결과, 80억 파라미터(8B)의 소규모 모델임에도 불구하고, DeepAnalyze는 기존의 최신 사전 훈련된 상용 LLM을 기반으로 구축된 워크플로우 기반 에이전트들을 모두 상회하는 성능을 보였다. DeepAnalyze의 모델, 코드 및 훈련 데이터는 모두 오픈소스로 공개되어, 자율 데이터 과학의 실현을 위한 길을 열었다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
DeepAnalyze: 자율 데이터 과학을 위한 에이전트형 대규모 언어 모델 | 연구 논문 | HyperAI초신경