AI 코딩 서비스에 떼려야 떼지 못하는 '인퍼런스 화이트'의 폭주, 가격 구조 전면 재편 초읽기
3일 전
AI 코딩 서비스 업계에 '인퍼런스 왈루스'(Inference whales)라 불리는 초고비용 사용자들이 등장하며 시장 구조가 흔들리고 있다. 이들은 월 구독료를 지불하고도 수천 달러에 달하는 AI 추론 비용을 발생시키며, 특히 Anthropic의 'Claude Code' 서비스에서 두드러진다. 일부 사용자는 단 2개월 만에 110억 토큰 이상을 소비해 약 3만5천 달러의 비용을 발생시키며, 이는 월 200달러 구독료와 비교해 극심한 손실을 초래한다. 이에 따라 Anthropic는 8월 28일부터 주간 사용 한도를 도입해 초과 시 추가 비용을 부과하는 방식으로 가격 정책을 전면 개편한다. 이는 단순한 수익 보호를 넘어, 공정한 자원 분배와 서비스 안정성을 확보하기 위한 조치다. 같은 맥락에서 Cursor도 유사한 문제를 겪으며 기존 무제한 구독을 단계별 유료 사용 모델로 전환했으나, 소통 부족으로 사용자 불만이 커졌다. 전문가들은 인퍼런스 비용이 예상처럼 하락하지 않으며, 고성능 모델의 도입과 자동화된 '에이전트 워크플로우'의 확산으로 인해 토큰 소비가 급증하고 있다고 지적한다. 결국 '가장 강력한 모델'을 원하는 사용자들의 욕구와, 비용 구조의 불일치는 기존 구독 모델의 지속 가능성에 근본적인 위협이 되고 있다. AI 코딩 서비스의 미래는 더 이상 '무제한'이 아닌, 효율적 자원 관리와 정교한 가격 전략에 달려 있다.
Related Links
Business Insider