Claude Code、非公開の運用で性能を飛躍強化
Anthropic のコード支援 AI「Claude Code」の性能向上プロジェクトが、Snorkel AI を通じて進められています。この内部プロジェクト名「Marlin」では、約 1,000 名の外部ソフトウェアエンジニアが、同 AI がプロの開発者と同じレベルのコードを生成できるよう、トレーニングと評価に参加しています。Snorkel は 2019 年にスタンフォード大学の研究者によって設立され、Google や Meta、Anthropic など大手テック企業の AI モデル開発を支援するデータプラットフォームとして知られています。2025 年 5 月には Series D ラウンドで 13 億ドルの評価額を得ましたが、同年 9 月に従業員数の 13% を削減しています。 プロジェクトの現場では、ソフトウェアの専門知識を持つフリーランスが 1 作業あたり 280 ドルで報酬を受け取っています。1 つのタスクには平均 1 時間がかかり、提出前に Snorkel の承認層でのやり取りが必要な場合もあります。作業内容は、2 つの異なる AI モデルが生成したコードを比較し、どちらが望ましいかを選別する A/B テストが中心です。具体的には、GitHub リポジトリから選定した事例に基づき、機能追加やバグ修正を提案するプルリクエストのシナリオを作成し、Claude Code に指示を出してコードを出力させます。その後、出力されたコードの効率性、明確さ、保守のしやすさを評価します。例えば、システムのメタデータ処理を再構築するタスクや、機械学習プラットフォームのセキュリティ対策を実装するタスクなど、実際の開発現場で発生する課題をモデルに提示しています。特にセキュリティ分野では、不正なコマンド注入を防ぎつつ正当なパッケージインストールを許可するような、実運用レベルのコードが求められます。 このプロジェクトは、AI が生成したコードがプロフェッショナルな開発者が求める詳細さと品質を備えているかを確認することを目的としており、Claude Code が生成するコードをより簡潔で維持しやすいものにする方向性を強化しています。 contractors は評価モデルのバージョンを知らされていない状態であり、客観的な判断を求めています。 AI 技術の高度化に伴い、データラベリングやトレーニングの需要は単純作業から、高度な専門知識や学位を要する分野へシフトしています。Snorkel のような企業は博士号や同等の経験を持つ専門家を集めており、熟練したエンジニアは週あたり 3,000 ドルを超える報酬を得ることもあります。同様のプラットフォームには Scale AI や Mercor もあり、世界中のエンジニアが高額報酬で AI 学習に携わっています。Snorkel や Anthropic は取材に対しコメントを拒否しました。このように、見えない形で展開される大規模な人間による学習プロジェクトが、次世代の AI 開発の基盤を形成し続けています。
