2달 전

지식 내재형 라우팅 네트워크를 이용한 장면 그래프 생성

Tianshui Chen; Weihao Yu; Riquan Chen; Liang Lin
지식 내재형 라우팅 네트워크를 이용한 장면 그래프 생성
초록

장면을 깊이 이해하는 것은 개별 객체의 위치를 파악하거나 인식하는 것뿐만 아니라, 그들 간의 관계와 상호작용을 추론하는 것을也需要. 그러나 실제 세계의 관계 분포가 심각하게 불균형하기 때문에, 기존 방법들은 빈도가 낮은 관계에 대해 매우 부정확한 성능을 보입니다. 본 연구에서는 객체 쌍과 그들의 관계 사이의 통계적 상관관계가 의미 공간을 효과적으로 규제하고 예측의 모호성을 줄일 수 있음을 발견하였습니다. 이를 통해 불균형한 분포 문제를 잘 해결할 수 있습니다. 이를 달성하기 위해, 우리는 이러한 통계적 상관관계를 딥 뉴럴 네트워크에 통합하여 지식 내재 라우팅 네트워크(Knowledge-Embedded Routing Network)를 개발하여 장면 그래프 생성을 지원합니다. 구체적으로, 이미지에서 나타나는 객체들과 그들의 관계 사이의 통계적 상관관계는 구조화된 지식 그래프로 명시적으로 표현될 수 있으며, 이 그래프를 통해 메시지를 전달하여 그들 간의 상호작용을 탐색하도록 하는 라우팅 메커니즘이 학습됩니다. 대규모 Visual Genome 데이터셋에서 수행된 광범위한 실험들은 제안된 방법이 현재 최신 경쟁자들보다 우수함을 입증하였습니다.注:在上述翻译中,“也需要”这一中文部分似乎是误加的,因此未被翻译成韩文。如果您需要进一步修改或有其他要求,请告知。