2달 전

MSTA3D: 3D 인스턴스 분할을 위한 다중 스케일 트윈 어텐션

Tran, Duc Dang Trung ; Kang, Byeongkeun ; Lee, Yeejin
MSTA3D: 3D 인스턴스 분할을 위한 다중 스케일 트윈 어텐션
초록

최근, 슈퍼포인트를 통합한 트랜스포머 기반 기술이 3D 인스턴스 분할에서 널리 사용되고 있습니다. 그러나 이러한 기술들은 특히 큰 객체에서 과분할 문제를 자주 겪습니다. 또한, 슈퍼포인트 마스크 예측에서 발생하는 신뢰성 없는 마스크 예측이 이 문제를 더욱 복잡하게 만듭니다. 이러한 도전과제를 해결하기 위해, 우리는 MSTA3D라는 새로운 프레임워크를 제안합니다. 이 프레임워크는 다중 스케일 특징 표현을 활용하고, 쌍 주의 메커니즘(twin-attention mechanism)을 도입하여 이를 효과적으로 포착합니다. 또한, MSTA3D는 박스 쿼리와 박스 정규화기(box regularizer)를 통합하여, 의미론적 쿼리와 함께 보완적인 공간 제약 조건을 제공합니다. ScanNetV2, ScanNet200 및 S3DIS 데이터셋에 대한 실험 평가 결과, 우리의 접근 방식이 최신 3D 인스턴스 분할 방법들을 능가함을 입증하였습니다.

MSTA3D: 3D 인스턴스 분할을 위한 다중 스케일 트윈 어텐션 | 최신 연구 논문 | HyperAI초신경