1.5Bパラメータの次編集予測モデル「Sweep Next-Edit」がリリース、ローカルで500ms未満で動作
Sweep AIが公開した「sweep-next-edit-1.5B」は、次に編集すべきコードを予測する15億パラメータのモデルで、Q8_0形式に量子化されたGGUFフォーマットで提供されている。このモデルは、ローカル環境のノートPC上でも500ミリ秒未満で動作し、スペキュラティブデコードを活用することで、4倍以上のパラメータを持つモデルを上回る性能を実現している。次編集予測(next-edit autocomplete)のベンチマークで高い精度を示しており、開発者の作業効率向上に貢献する。 モデルの利用には、run_model.pyとモデルファイルをダウンロード後、llama-cpp-pythonとhuggingface_hubをインストールして実行する。入力にはファイルのコンテキスト、最近の差分(diff)、現在のコード状態を含む特定のプロンプトフォーマットが必須で、run_model.pyに具体的な使用例が記載されている。 技術的な詳細やベンチマーク結果は公式ブログで公開されており、JetBrains IDE向けのプラグインも提供されており、開発者環境への統合が容易である。ライセンスはApache 2.0で、商用利用も可能。 このモデルは、コードの自動補完を「予測」するという新しいアプローチを実現しており、開発者の思考プロセスを補完するAIツールとして注目されている。Sweep AIは、このモデルを基盤に、より直感的で効率的な開発体験を提供することを目指している。
