2달 전

그래프 신경망을 이용한 빠른 상호작용형 비디오 객체 분할

Varga, Viktor ; Lőrincz, András
그래프 신경망을 이용한 빠른 상호작용형 비디오 객체 분할
초록

이미지 시퀀스의 픽셀 단위 주석은 인간에게 매우 번거로울 수 있습니다. 대화형 비디오 객체 분할은 자동 방법을 활용하여 이 과정을 가속화하고 주석 작업자의 부담을 줄이는 것을 목표로 합니다. 현대적인 접근 방식 대부분은 비디오 전체에서 인간 주석 정보를 수집하고 처리하기 위해 깊은 합성곱 네트워크(Deep Convolutional Networks)에 의존합니다. 그러나 이러한 네트워크는 수백만 개의 매개변수를 포함하며, 과적합을 피하기 위해서는 대량의 라벨링된 훈련 데이터가 필요합니다. 또한, 라벨 전파는 일반적으로 프레임별 추론 단계로 수행되며, 병렬화하기 어려워 시간이 많이 소요됩니다. 본 논문에서는 대화형 비디오 객체 분할 문제를 해결하기 위한 그래프 신경망(Graph Neural Network) 기반 접근 방식을 제시합니다. 우리의 네트워크는 슈퍼픽셀 그래프(Superpixel-Graphs) 위에서 작동하여 문제의 차원성을 크게 줄일 수 있습니다. 우리는 몇천 개의 매개변수만으로도 최고 수준의 성능을 달성할 수 있으며, 추론이 빠르게 이루어지고 매우 적은 데이터로도 빠르게 훈련될 수 있음을 보여줍니다.

그래프 신경망을 이용한 빠른 상호작용형 비디오 객체 분할 | 최신 연구 논문 | HyperAI초신경