HyperAI초신경

Image Text Matching

이미지-텍스트 매칭은 크로스 모달 검색(CMR)의 하위 작업으로, 이미지와 해당 텍스트 설명 간의 연관성을 설정하는 것을 목표로 합니다. 이 작업의 목적은 텍스트 쿼리가 주어졌을 때 관련 이미지를 검색하거나, 이미지 쿼리가 주어졌을 때 해당 텍스트 설명을 검색하는 것입니다. 이미지와 텍스트 데이터 표현 사이의 이질성 간극 때문에 이 작업은 어려운 편이며, 컨텐츠 기반 이미지 검색, 시각적 질문 응답, 다중 모달 요약 등의 시나리오에서 널리 활용됩니다.