2ヶ月前
FB-OCC: 前後視点変換に基づく3D占有予測
Zhiqi Li; Zhiding Yu; David Austin; Mingsheng Fang; Shiyi Lan; Jan Kautz; Jose M. Alvarez

要約
この技術報告書は、CVPR 2023 Workshop on End-to-End Autonomous Driving および CVPR 23 Workshop on Vision-Centric Autonomous Driving と連携して開催された3D占有予測チャレンジの優勝ソリューションを要約しています。我々が提案するFB-OCCは、先進的なカメラベースの鳥瞰図認識設計であるFB-BEVを基盤としています。FB-BEVに加えて、我々は3D占有予測タスクに特化した新しい設計と最適化手法を研究しました。それには、深度-意味論的前学習(joint depth-semantic pre-training)、ボクセル-BEV表現(joint voxel-BEV representation)、モデルのスケーリングアップ(model scaling up)、および効果的な後処理戦略(effective post-processing strategies)が含まれます。これらの設計と最適化により、nuScenesデータセットにおいて最先端のmIoUスコア54.19%を達成し、チャレンジトラックで1位となりました。コードとモデルは以下のURLで公開されます: https://github.com/NVlabs/FB-BEV.