17일 전

비지도 광류에서 비용 함수의 전개

Gal Lifshitz, Dan Raviv
비지도 광류에서 비용 함수의 전개
초록

딥러닝에서 흔히 사용되는 가장 급격한 강하 알고리즘은 경사 벡터를 하강 방향으로 사용하며, 조건부 전처리(preconditioning)를 통해 방향을 조정한 후 사용하기도 한다. 많은 상황에서 복잡하거나 미분 불가능한 비용 함수로 인해 경사 값을 수치적으로 계산하는 것이 어렵고, 특히 특이점(특이점) 근처에서는 더욱 그렇다. 본 연구에서는 비감독적 비용 함수에서 흔히 사용되는 총 변동(Total Variation) 반노름의 도출에 초점을 맞춘다. 구체적으로, 새로운 반복적 기법인 '비용 전개(Cost Unrolling)'를 제안하며, 이 기법을 통해 어려운 L1 평활성 제약 조건에 대해 미분 가능한 대체 함수를 도출한다. 학습 과정에서 보다 정확한 경사를 생성함으로써, 아키텍처를 변경하거나 계산 복잡도를 증가시키지 않고도, 모델의 수렴 성능을 향상시켜 더 정교한 예측이 가능하게 한다. 본 방법을 비감독 광류(optical flow) 추정 작업에 적용하여 검증하였다. 잘 알려진 기준 모델의 학습 과정에서 L1 평활성 제약 조건을 본 연구의 전개된 비용 함수로 대체함으로써, MPI Sintel 및 KITTI 2015 비감독 광류 벤치마크에서 모두 개선된 성능을 보고하였다. 특히, 평활성 제약 조건이 주도적인 부분인 가림 영역의 에이전트 평균 오차(EPE)는 최대 15.82%까지 감소하였으며, 이는 더 선명한 운동 경계를 탐지할 수 있음을 의미한다.