16일 전

OneNet: 채널별 1차원 컨볼루션 U-Net

Sanghyun Byun, Kayvan Shah, Ayushi Gang, Christopher Apton, Jacob Song, Woo Seong Chung
OneNet: 채널별 1차원 컨볼루션 U-Net
초록

최신 컴퓨터 비전 아키텍처 중 많은 수가 유연성과 효율적인 특징 추출 능력 덕분에 U-Net을 활용하고 있다. 그러나 다중 해상도 컨볼루션 설계는 종종 상당한 계산 부담을 초래하여 엣지 장치에의 배포를 제한한다. 본 연구에서는 이러한 문제를 해결하기 위해, 정확도를 유지하면서도 엣지 응용에 더 적합한 간소화된 대안을 제안한다. 제안하는 새로운 인코더 아키텍처는 채널 단위 1D 컨볼루션과 픽셀 언슈풀(Pixel-unshuffle) 연산을 결합하여 의미론적 세그멘테이션을 수행한다. 특히, 초해상도 처리에서 정확도를 향상시키면서도 계산 부담을 줄이는 것으로 잘 알려진 PixelShuffle를 도입함으로써, 2D 컨볼루션 없이도 공간적 관계를 효과적으로 포착할 수 있으며, 파라미터 수를 최대 47%까지 감소시킬 수 있다. 또한, 완전히 1D 기반의 인코더-디코더 구조를 탐색한 결과, 크기를 71% 감소시킬 수 있었지만, 약간의 정확도 손실이 발생하였다. 다양한 마스크 생성 작업에서 U-Net의 다양한 변형과 비교하여 성능을 평가한 결과, 제안한 방법이 정확도를 효과적으로 유지함을 입증하였다. 비록 본 연구는 이미지 세그멘테이션에 초점을 맞추고 있지만, 이 아키텍처는 다른 컨볼루션 기반 응용에도 확장 가능하다. 프로젝트 코드는 https://github.com/shbyun080/OneNet 에서 공개되어 있다.

OneNet: 채널별 1차원 컨볼루션 U-Net | 최신 연구 논문 | HyperAI초신경