
要約
近年、大規模言語モデル(Large Language Models)はコード生成の分野で広く利用されている。OpenAIが開発したGPT-4は、現時点で最も強力な大規模言語モデルとされている。本研究では、GPT-3.5およびGPT-4をコーディングアシスタントとして評価した。具体的には、以下の3つの観点から適切なテストを構築し、2つのシステムが(a)開発プロセス中に発生しうる典型的な質問に適切に対応できるか、(b)信頼性の高いコードを生成できるか、(c)デバッグ作業に貢献できるかを検証した。その結果は非常に高く評価できるものであった。GPT-4の性能は顕著であり、プログラマーの生産性の向上およびこれらの新技術を基盤とするソフトウェア開発プロセスの再構築を示唆している。