클라우드 오퍼스 4.1 출시, 프로그래밍 능력 한층 강화될 전망
2025년 8월 5일, Anthropic는 엔드유저 및 개발자용으로 최신 업데이트인 Claude Opus 4.1을 공개했다. 이는 전 모델인 Opus 4 출시 후 단 3개월 만의 빠른 업그레이드로, 주로 프로그래밍 능력, 자율 작업 수행(아젠트 작업), 논리적 추론 등 핵심 기능에서 향상됐다. 현재는 유료 사용자, Claude Code, API, Amazon Bedrock, Google Cloud Vertex AI를 통해 이용 가능하며, 가격은 Opus 4와 동일한 100만 토큰당 입력 15달러, 출력 75달러로 유지된다. 주요 성능 지표로는 소프트웨어 엔지니어링 테스트 SWE-bench Verified에서 74.5%를 기록해 Opus 4의 72.5%를 넘어섰으며, OpenAI o3(69.1%)과 구글 Gemini 2.5 Pro(67.2%)를 압도했다. 또한 Terminal-Bench에서 43.3%로 Opus 4(39.2%)보다 뛰어난 성능을 보였다. GitHub은 다중 파일 코드 리팩터링에서 두드러진 향상을 인정했고, 일본의 라쿠텐 그룹은 대규모 코드베이스에서 정확한 수정만 수행하며 부가적 오류를 유발하지 않는 점을 높이 평가했다. Windsurf는 신입 개발자 수준 테스트에서 1개 표준편차의 성능 향상을 기록하며 Sonnet 3.7에서 Sonnet 4로의 진보와 비슷한 수준이라고 설명했다. 안전성 측면에서도 ASL-3 기준으로 작동하며, 정책 위반 요청 거부율이 97.27%에서 98.76%로 상승했다. 다만 GPQA Diamond 등 일반 추론 테스트에서는 Gemini 2.5 Pro(86.4%)와 o3(83.3%)에 미치지 못했고, AIME, MMMU 등에서 경쟁사와 근소한 차이로 뒤지며 절대적 우위는 아니었다. 이러한 성과는 Anthropic의 수익 성장과도 맞물린다. 연간 반복 수익(ARR)은 7개월 만에 10억에서 약 50억 달러로 급증했으며, 개발자 전용 서비스인 Claude Code의 연간 수익은 4억 달러에 달하고 최근 2배 성장했다. 이에 힘입어 Anthropic는 Iconiq Capital 주도로 최대 50억 달러 규모의 투자를 진행 중이며, 평가액은 약 1700억 달러로, OpenAI, SpaceX에 이어 세계 3대 유니콘 기업으로 부상할 전망이다. Anthropic는 “앞으로 더 큰 개선을 예고하며, GPT-5 등 경쟁 모델에 대한 전략적 대응”을 강조했다. 이는 AI 시장의 새로운 격전이 시작됨을 시사한다.