AIコーディングサービスに「推論 Whale」が乱入、無制限プランの持続可能性に疑問
AIコーディングサービスの急速な普及に伴い、「推論の巨頭(Inference Whales)」と呼ばれる少数のユーザーが、高額なAI推論コストを発生させ、多くのスタートアップに経営上の危機をもたらしている。これらのユーザーは、月額定額制のサービスを利用して長時間にわたる自動化タスクを大量に実行し、1人で数千万〜10億トークン以上を消費するケースも報告されている。トークンはAIが処理するデータ単位で、使用量に応じてコストが発生する。たとえば、Anthropicの「Claude Code」サービスで月額200ドルの無制限プランを利用していた開発者1人が、わずか数ヶ月で約3万5000ドル相当の推論コストを発生させた。これに対して支払いは200ドルにとどまるため、企業は赤字を被る状態に陥った。 この問題に直面したAnthropicは、2024年8月28日から月額200ドルプランに週単位の使用量制限を導入する方針を発表。制限を超える利用には追加料金が必要になる。同社は「極端な利用がコミュニティ全体のパフォーマンスに悪影響を及ぼしている」と説明。また、アカウント共有やアクセスの転売といった政策違反も確認されており、公平なサービス提供のための措置としている。 スウェーデン在住の開発者アルベルト・オーワル氏は、自らのVibeコーディングプラットフォーム構築のためにClaude Codeを頻繁に使用。1日あたりの推論コストが500ドルに達する状況で、月額200ドルのプランでは持続不可能と認めた。彼は新制度下でもコストを抑えるために、開発スタイルを見直す予定と語った。 同様に、AIコーディングサービス「Cursor」も、無制限プランを段階的使用制限付きに切り替え、ユーザーの混乱を招いた。その背景には、AIモデルの進化に伴い推論コストが下がるという期待があるが、実際には新しい最強モデルが登場するたびにコストが上昇し、ユーザーは「最高のモデル」を求める傾向が強い。これにより、単純なコスト削減は不可能に近い。 テキストQLのエサン・ディングCEOは、「推論コストの低下という前提が根本的に崩れている」と指摘。AIの能力向上に伴い、自動化タスクが複雑化し、1回の作業で100万トークンから1億トークンにまで増えるため、たとえ単価が下がっても総コストは増加する。結果として、月額20ドルのサブスクリプションで無制限利用を維持することは「数学的に不可能」と結論づけた。 AIコーディングの未来は、無制限サブスクリプションではなく、使用量に応じた透明な課金モデルと、開発者の意識改革が不可欠であるという課題が浮き彫りになった。