
要約
セマンティックセグメンテーション向けに高性能なニューラルネットワークを訓練するためには、未観測データに対して一般化できるように、十分な量のラベル付き教師データ(グランドトゥース)を備えた大規模なデータセットを用意することが不可欠である。本論文では、データセットを人工的に多様化するための新しいポイントクラウド増強手法を提案する。これらのセンサ中心のアプローチは、LiDARセンサの物理的特性と整合性を保ちつつ、データ構造を維持する。本手法により、低価値なデータに高価値なインスタンスを付加することができるとともに、まったく新しいシーンの生成も可能となる。提案手法は、公開されているSemanticKITTIデータセットを用いて複数のニューラルネットワークで検証された結果、それぞれのベースラインと比較して性能が向上することが示された。さらに、本手法により極めて小さなデータセットでも有効な学習が可能となることを示し、アノテーション時間、学習時間、および関連コストの大幅な削減が実現可能であることを明らかにした。