점진적 수용영역 구성 요소 추론을 통한 옴니-수퍼바이즈드 포인트 클라우드 세그멘테이션

신경망의 숨겨진 특징은 출력 예측에만 감독이 주어지기 때문에 3D 세그멘테이션을 위한 정보성 표현을 학습하는 데 일반적으로 실패한다. 그러나 중간 레이어에 걸쳐 옴니 스케일 감독을 적용하면 이 문제를 해결할 수 있다. 본 논문에서는 제안된 점진적 수용장역(Receptive Field Component Reasoning, RFCR)을 통해 포인트 클라우드 세그멘테이션에 처음으로 옴니 스케일 감독 방법을 도입한다. 여기서는 인코더의 은닉 유닛들의 수용장 내 카테고리 정보를 기록하기 위해 타겟 수용장 구성 요소 코드(Target Receptive Field Component Codes, RFCCs)를 설계한다. 이후 타겟 RFCCs는 디코더를 통해 거시적에서 미시적 방향으로 카테고리 추론을 점진적으로 수행하도록 감독하며, 최종적으로 의미적 레이블을 도출한다. 많은 은닉 특징들이 미미한 크기로 활성화되지 않으며 RFCC 예측에 미미한 기여를 하기 때문에, 더 명확한 특징을 얻기 위해 원심력 잠재력(centrifugal potential)을 활용한 특징 밀도화(Feature Densification)를 제안한다. 이는 특징에 대한 엔트로피 정규화와 실질적으로 동일한 효과를 가진다. 더 활성화된 특징들은 본 옴니 감독 방법의 잠재력을 더욱 극대화할 수 있다. 본 방법을 네 가지 대표적인 백본 아키텍처에 통합하여 세 가지 도전적인 벤치마크에서 테스트한 결과, 모든 데이터셋에서 백본의 성능을 상당히 향상시켰다. 특히 S3DIS와 Semantic3D에서 새로운 최고 성능(SOTA)을 달성하였으며, 포인트 기반 방법 중에서 ScanNet 벤치마크에서 1위를 기록하였다. 코드는 공개적으로 https://github.com/azuki-miho/RFCR 에서 제공될 예정이다.