AIエージェントの最適なインターフェースはMCPではなくCLI――50年も前から存在するUnixのコマンドラインが真の未来を切り開く
AIエージェントのインターフェースとして、新しいプロトコル「MCP」よりも既存のコマンドラインインターフェース(CLI)が最適であるという主張が広がっている。OpenAIの共同創業者Andrej Karpathy氏の指摘と同様に、AIの限界を認識しつつ、実用的なアプローチを模索する声が高まっている。著者は、AIエージェントの最良のインターフェースは、1971年から存在するUnixのコマンドラインであると明言。その理由は、CLIがすでにすべての主要サービスに搭載されており、プロダクションレベルで検証済みであり、AIモデルの学習データにも深く組み込まれているためだ。 AIがリアルタイムで意思決定を行う時代に、従来のSaaSやAPI、統合プラットフォームといった「事前定義された連携層」は不要になる。AIエージェントが目的を理解し、必要なコマンドを生成して即座に実行する。このプロセスは、MCP(モデルコンテキストプロトコル)のような新規プロトコルを介さず、既存のCLIを通じて実現可能。MCPはAPI連携の標準化という点で価値があるが、実装コストが高く、多くの場合、CLIで既に達成可能な機能を再構築している。 実際のベンチマークでは、ブラウザ自動化においてCLIベースのアプローチがMCPと同等以上の性能を発揮。CLIは自己文書化されており、ヘルプやマニュアルが標準装備。また、Unixの「小規模なツールをパイプでつなぐ」哲学は、AIエージェントの構成に理想的。MCPではエージェントとツールの橋渡しを自前で構築する必要があるが、CLIではその橋渡しが既に存在し、エージェントは権限を与えるだけで利用可能。 ただし、CLIにはリスクもある。シェルアクセスを持つエージェントはユーザー権限であらゆることを実行できるため、セキュリティ上の注意が必要。MCPは制限を明示的に設定できる点で利点があるが、CLIではホワイトリストや実行制御による工夫が不可欠。 結論として、CLIは既存のインフラとAIの接点として、最も堅牢で普遍的なインターフェースである。AIエージェント開発では、新規プロトコルよりも既存のCLIを活用する戦略が、実用性と効率性において優位性を持つ。実際のコード例では、Grok 3 FastモデルがCLIツールを直接呼び出し、git、ls、grepなどを使ってタスクを遂行するMVP(最小限の実証)を実現。MCPサーバーやSDK、スキーマを一切不要にしたシンプルなアーキテクチャが示された。AIの未来は、新技術の導入ではなく、すでに存在する「シンプルで強力な基盤」の再利用にある。
