
초록
일반적인 컨벌루션 네트워크는 RGB 이미지에서 훈련되고 실행됩니다. 그러나 실제 응용 프로그램에서는 메모리 절약과 효율적인 전송을 위해 이미지를 압축하는 경우가 많습니다. 본 논문에서는 JPEG 표준으로 정의된 이산 코사인 변환(DCT) 표현을 사용하여 의미 분할을 수행하는 방법을 탐구합니다. 먼저 DCT 계수를 재배열하여 선호되는 입력 형식을 만든 다음, 기존 네트워크를 DCT 입력에 맞게 조정합니다. 제안된 방법은 네트워크 복잡도가 거의 동일한 상태에서 RGB 모델과 유사한 정확도를 보입니다. 또한, 다른 DCT 구성 요소를 선택하는 것이 분할 성능에 미치는 영향을 조사합니다. 적절한 선택을 통해 전체 DCT 계수의 약 36%만 사용해도 같은 수준의 정확도를 달성할 수 있습니다. 우리는 또한 양자화 오류 하에서 우리 방법의 견고성을 보여줍니다. 우리의 지식으로는, 본 논문이 DCT 표현을 사용한 의미 분할에 대한 첫 번째 연구임을 확인할 수 있습니다.