프레이즈 그라운딩

Phrase Grounding은 자연어 처리 분야의 하위 작업으로, 이미지 캡션에서 명사 구로 언급된 각 개체를 해당 이미지의 영역과 일치시키는 것을 목표로 합니다. 이 작업은 이미지와 텍스트 간의 세부적인 연관성을 설정하여 다중 모달 데이터의 이해와 상호작용 능력을 향상시키며, 시각적 질문 응답, 이미지 검색, 자동 이미지 주석 등의 애플리케이션 성능을 개선하는 데 중요한 역할을 합니다.

프레이즈 그라운딩 | SOTA | HyperAI초신경