11日前

GPTドライバー:GPTを用いた運転の学習

Jiageng Mao, Yuxi Qian, Junjie Ye, Hang Zhao, Yue Wang
GPTドライバー:GPTを用いた運転の学習
要約

本稿では、OpenAIのGPT-3.5モデルを自律走行車の信頼性の高い運動計画(motion planning)モデルに変換できる、シンプルかつ効果的なアプローチを提示する。運動計画は自律走行技術における核心的な課題であり、安全かつ快適な走行軌道を生成することを目的としている。従来の運動計画手法は、主にヒューリスティックなアプローチを用いて走行軌道を予測していたが、新しいあるいは未経験の走行状況に対しては十分な汎化能力を示さないという課題を抱えていた。本研究では、大規模言語モデル(Large Language Models: LLMs)が持つ強力な推論能力および汎化可能性を活用する、新たな運動計画アプローチを提案する。本アプローチの基本的洞察は、運動計画を言語モデリング問題として再定式化する点にあり、これはこれまでに検討されてこなかった新たな視点である。具体的には、計画器の入力と出力を言語トークンとして表現し、座標位置の自然言語記述を通じてLLMが走行軌道を生成する仕組みを構築した。さらに、LLMの数値推論能力を引き出すための新たな「プロンプト提示-推論-微調整(prompting-reasoning-finetuning)」戦略を提案した。この戦略により、LLMは高精度な軌道座標を記述するだけでなく、内部の意思決定プロセスを自然言語で説明することも可能となる。本手法は大規模なnuScenesデータセットを用いて評価され、広範な実験により、本手法が有効性、汎化能力、解釈可能性の面で優れていることが実証された。コードは現在、https://github.com/PointsCoder/GPT-Driver にて公開されている。

GPTドライバー:GPTを用いた運転の学習 | 最新論文 | HyperAI超神経