
要約
本報告では、CVPR 2023 3D占有予測チャレンジの4位の解法を紹介します。我々は、lift-splat-shootフレームワークに基づく単純な手法であるMulti-Scale Occ(多尺度占有)を提案します。この手法は、複数の過去フレームの時間融合を用いて、より良い多尺度3Dボクセル特徴量を生成するために多尺度画像特徴量を導入しています。さらに、モデルアンサンブル、テスト時拡張(test-time augmentation)、およびクラスごとの閾値設定(class-wise thresh)などの後処理が採用され、最終的な性能向上に寄与しています。リーダーボードの結果によれば、我々が提案した占有予測手法は49.36 mIoUで4位となっています。