17일 전

시나리오 그래프 생성을 위한 개선된 객체 탐지 모델

{Mohamed F. Tolba, Howida A. Shedeed, Dina Khattab, Mohammad Essam}
초록

컴퓨터 비전 기술의 발전에 따라, 의미 이미지 검색, 이미지 설명 생성, 장면 이해와 같은 더 복잡한 문제를 해결하기 위해 더 높은 수준의 이해가 필요해지고 있다. 장면 이해는 그 복잡성과 적절한 데이터 표현의 부족으로 인해 오랫동안 연구되어온 문제이다. 장면 그래프(Scence Graph)는 장면의 맥락을 더 잘 이해할 수 있도록 하는 가장 강력한 데이터 표현 방식 중 하나이다. 장면 그래프의 목적은 장면 내에 등장하는 객체들, 그들의 속성, 그리고 객체 간의 관계를 모두 인코딩하는 것이다. 장면 그래프가 복잡한 작업에서 그 가능성을 입증함에 따라, 장면 그래프 생성의 자동화는 필수적인 과제가 되었다. 다양한 딥러닝 아키텍처를 활용하여 정확한 장면 그래프를 생성하기 위한 많은 연구가 이루어져 왔다. 이러한 다양한 아키텍처들 사이에서 공통적으로 사용되는 모듈은 객체 탐지 모듈로, 입력 이미지 내에서 객체를 먼저 위치 파악하는 단계이다. 본 연구에서는 장면 그래프 생성 작업에 YOLOv5 계열의 최신 객체 탐지기들을 활용하는 것을 제안한다. 제안하는 YOLOv5x6는 기존 연구 대비 32.7의 평균 정밀도(mAP)로 최신 기술 수준(State-of-the-Art) 성과를 달성하였다. 또한 본 논문은 장면 그래프 생성 작업에 활용된 다양한 객체 탐지기들을 문헌을 기반으로 종합적으로 검토한다.