
초록
딥러닝 방법은 원시 픽셀에서 특징을 학습하는 능력 덕분에 보행자 검출 분야에서 큰 성공을 거두었습니다. 그러나 이러한 방법은 주로 보행자의 자세와 같은 중간 수준의 표현을 포착하며, 나무 줄기나 전봇대와 같은 긍정적 샘플과 어려운 부정적 샘플 사이의 큰 모호성을 구분하지 못합니다. 이 모호성은 고수준 표현을 통해 구별할 수 있습니다. 이를 위해 본 연구에서는 보행자 검출과 의미론적 작업(보행자 속성 예: '배낭 지참', 장면 속성 예: '도로', '나무', '수평')을 공동으로 최적화하는 방법을 제안합니다. 장면 속성을 비싸게 주석화하는 대신, 기존의 장면 분할 데이터셋에서 속성 정보를 보행자 데이터셋으로 전송합니다. 이를 위해 다중 작업 및 다중 데이터 소스에서 고수준 특징을 학습하도록 설계된 새로운 딥러닝 모델을 제안합니다. 서로 다른 작업들은 서로 다른 수렴률을 가지며, 서로 다른 데이터셋의 데이터는 서로 다른 분포를 가집니다. 따라서 다중 작업 목적 함수가 신중하게 설계되어 작업 간 조율과 데이터셋 간 차이 축소를 담당합니다. 이 목적 함수 내의 작업 중요도 계수와 네트워크 매개변수는 반복적으로 추정될 수 있습니다. 광범위한 평가 결과에 따르면, 제안된 접근 방식은 도전적인 Caltech와 ETH 데이터셋에서 기존의 최신 딥러닝 모델보다 우수한 성능을 보였으며, 각각 17%와 5.5%의 누락률 감소를 이끌어냈습니다.