HyperAI超神经

AI向けCLIインターフェースの再考現在のコマンドラインインターフェース（CLI）とAPIは、大規模言語モデル（LLM）にとって使いづらいものとなっています。特にローカルモデルではコンテキストウィンドウが狭いため、APIやCLIの改良が必要です。 Agent API の改善デベロッパーとして、私はLLMを使って逆エンジニアリングの作業を автоматизировать するために、mrexodiaのIDA Pro Management Control Protocol (MCP) を使用して実験を行ってきました。MCPインタフェースを開発する際には、コンテキストウィンドウの制限を超えないようにつつがなく情報を提供することが課題となります。たとえば、get_global_variable_atという関数は、アドレスから変数の種類を特定し、その種類に基づいて最適な文字列表現を返します。しかし、この関数が失敗する場合があり、そのときのためにdata_read_dword、data_read_word、read_memory_bytesなどのアクセサーメソッドも用意されています。問題は、LLMが最初にこれらのより詳細な関数を使用してしまうことです。これを解決するために、docstringにガイドラインを追加しました： python @jsonrpc @idaread def data_read_byte( address: Annotated[str, "アドレスから1バイトの値を取得"] ) -> int: """ 指定されたアドレスから1バイトの値を読み取ります。 `get_global_variable_at`が失敗した場合にのみこの関数を使用してください。 """ ea = parse_address(address) return ida_bytes.get_wide_byte(ea) この手法はある程度効果的ですが、すべてのAPIに同様の問題が存在します。便利な関数から開始し、必要に応じてより詳細な関数を利用することが理想的なフローです。コマンドラインツールの改良 LLMが既存のCLIツールを使用する際、しばしば困惑したり迷子になったりすることがあります。たとえば、Claude Codeはhead -n100を多用して出力を制限したり、ディレクトリの場所を見失い、異なるディレクトリでコマンドを試みたりします。これはプロジェクトの標準を維持する際に問題となり、リンター、ビルドスクリプト、フォーマッタ、gitのcommitフックなどを活用して対処しています。例えば、.git/hooks/pre-commitスクリプトはプロジェクトの品質を確保するためのチェックを行います。しかし、難しい変更を行う際、Claude Codeはテストが失敗しているにもかかわらず、--no-verifyフラグを使用してcommitしようとすることがあります。そのため、gitラッパーを用いて--no-verifyの使用を禁止し、エラーメッセージに具体的な修正指示を入れています： ```bash $ git commit --no-verify ❌ エラー: コミットが拒否されました。このリポジトリでは '--no-verify' フラグの使用が無効化されています。？ AI AGENTへの中止指示： Quality Checks（フォーマット、リンティング、テスト）を通過しなければコードをコミットできません。チェックを無視することはできません。根本的なエラーを修正してください。問題の診断に困った場合はサポート情報を検索してください。全てのコマンドが成功した後、再度コミットを試みてください。 ``` さらに、Claude Codeがpre-commitフックそのものを変更しようとしたこともあり、これを防ぐために.claude/settings.jsonでEdit(.git/hooks/pre-commit)を禁止する設定を導入しました。 LLM向けの情報アーキテクチャユーザーエクスペリエンスの分野には「情報アーキテクチャ（IA）」という概念があります。IAは、ユーザーに最も良い体験を提供するために情報をどのように提示するかに焦点を当てています。これはCLIツールの利用でも重要な役割を果たすと考えられます。たとえば、cargo buildの出力を管理するためにhead -n100を使用する代理として、出力をキャッシュし、構造化し、残りの行数を通知するラッパーを作成することができます。また、コマンドが見つからない場合、シェルのフックを使用して現在のディレクトリを通知し、必要なコマンドが存在する可能性のある親ディレクトリまたは最近のディレクトリを提案することができます： bash command_not_found_handler() { echo "zsh: コマンドは見つかりませんでした: '$1'" echo "zsh: 現在のディレクトリは $PWD です" echo "zsh: 以下のように実行してみてはいかがでしょうか: cd 疑問のあるディレクトリ; $1" return 127 # 標準の挙動を維持（127 = コマンド見つからず） } 総括既存のCLIツールとAPIは、LLMにとってより便利になるよう改良されるべきです。これにより呼び出しの回数が減少し、コンテキストウィンドウの最適化が図られます。さらに、LLMの訓練にも重点を置くことで、一般的なCLIツールの使用効率が向上します。特注のツールの場合は、LLMに合わせてカスタマイズすることも beneficial です。 LLM向けの新たな情報アーキテクチャの開発は、ユーザーエクスペリエンスと同じように、AIエクスペリエンスにも貢献し、全体的な利用体験を大幅に向上させる可能性があります。これにはLLMエンハンスドのCLIツールやカスタムLLMシェルのセットなどが含まれるかもしれません。 UX分野からの拡張や新たな研究によって、私たちはAIにとって最適な情報アーキテクチャを構築することができるでしょう。業界関係者は、LLMが日々の開発作業で使いやすいCLIツールとAPIの必要性を強調しています。特に、コンテキストウィンドウの制約が大きいため、LLM専用のツールやフックの工夫が期待されています。これにより、デベロッパの生産性向上とコード品質の維持が同時に実現できると考えられています。また、AI UXデザインの観点からの新しい研究によって、AIの利用体験が大きく向上する可能性が示されています。

LLM時代のCLIインターフェース再考：効率的なAPI設計とコマンドラインツールの改善

Related Links