Ai2 출시: 과학 연구를 위한 신뢰할 수 있는 AI 에이전트 생태계 '아스타' 등장
AI2는 과학 분야에서 신뢰할 수 있는 AI 에이전트를 위한 새로운 생태계 ‘아스타(Asta)’를 공개했다. 이는 연구자들이 실제 문제를 해결할 수 있도록 설계된 오픈소스 AI 연구 보조 도구, 과학적 작업을 평가할 수 있는 체계적인 벤치마크, 개발자용 툴킷으로 구성된 통합 시스템이다. 아스타는 기존의 투명성 부족하고 검증되지 않은 AI 도구들과 달리, 출처를 명시하고 재현 가능하며 과학적 엄격성을 기반으로 한다. 아스타의 핵심은 연구 워크플로우에 맞춘 AI 보조자로, 문헌 검토, 데이터 분석, 증거 통합을 수행하며, 모든 결과에 출처를 제공한다. 현재 194개 기관에서 활용 중이며, 치료 타겟 탐색 등 실제 연구 성과를 가속화하고 있다. 아스타벤치는 11개 벤치마크, 2,400개 이상의 과학적 문제를 기반으로 한 성능 평가 체계로, 코드 실행부터 종합적 탐구까지 다단계 과제를 평가할 수 있다. 초기 평가에서 아스타 v0는 52.5%의 성능을 기록하며 가장 높은 점수를 달성했다. 개발자들을 위해 제공되는 아스타 리소스는 오픈소스 모델, API, 과학 논문 데이터베이스(2억 건 이상)를 포함하며, 신뢰할 수 있는 과학 AI를 구축하고 평가할 수 있도록 지원한다. AI2는 ‘과학과 동등한 기준’을 적용해야 AI가 과학에 진정한 기여를 할 수 있다고 강조하며, 아스타가 단순한 도구가 아니라 연구자와 개발자가 함께 발전할 수 있는 생태계라고 설명했다. 향후 아스타는 사용자 데이터 업로드 기능을 통해 자연어로 복잡한 질문에 통계적 근거를 바탕으로 답변하는 데이터 분석 기능을 도입하고, 실험 재현, 과학 프로그래밍, 장기 연구 계획 등 고도화된 기능을 추가할 예정이다. 이는 AI가 연구의 전주기 과정을 지원하는 진정한 파트너로 성장할 수 있는 기반을 마련한다.