7日前
都市走行におけるインプリシットアフォーダンスを用いたエンドツーエンド型モデルフリー強化学習
Marin Toromanoff, Emilie Wirbel, Fabien Moutarde

要約
強化学習(Reinforcement Learning, RL)は、ルールベースの制御手法に頼らず、自らの実験から最適な行動方策を学習することを目指している。しかし、現時点では都市ドライブのような複雑なタスクを処理できるRLアルゴリズムは存在しない。本研究では、都市ドライブに有効に適用可能な新たな技術「インプリシット・アフォーダンス(implicit affordances)」を提案する。この技術により、車線維持、歩行者・車両の回避、信号機検出といった複数の課題を統合的に処理することが可能となる。本研究の知見によれば、我々は交通信号機の検出を含むこのような複雑なタスクを成功裏に処理するRLエージェントを初めて実現したと認識している。さらに、CARLAチャレンジの「カメラオンリー」トラックにおいて当該手法の有効性を実証し、優勝を達成した。