참조 이미지 분할
참조 이미지 분할(RIS)은 자연어 표현을 통해 참조되는 대상 객체를 분할하는 것을 목표로 합니다. 그러나 기존의 방법들은 문장이 이미지 속의 객체를 설명해야 한다는 강력한 가정에 의존하는데, 이는 실제 응용 프로그램에서는 종종 그렇지 않습니다. 따라서 이러한 방법은 표현식이 객체를 참조하지 않거나 두 개 이상의 객체를 참조하는 경우 실패합니다.
참조 이미지 분할의 목표는 자연어 표현을 통해 참조 대상을 분할하는 것입니다. 텍스트와 이미지 간의 데이터 속성이 다르기 때문에 네트워크가 텍스트와 픽셀 수준 기능을 잘 정렬하는 것은 어렵습니다.