의미적 텍스트 유사성
문장 의미 유사도(Semantic Textual Similarity, STS)는 자연어 처리에서 두 텍스트 간의 의미적 유사성을 평가하는 중요한 작업으로, 일반적으로 1에서 5까지의 등급 형태로 표현됩니다. 이 작업의 핵심 목적은 텍스트 간의 의미적 거리를 계산하여 같은 의미나 비슷한 의미를 가진 문장 쌍을 식별하는 것입니다. STS는 정보 검색, 질문-답변 시스템, 텍스트 클러스터링 등 다양한 분야에서 널리 활용되며, 이러한 시스템의 정확성과 효율성을 크게 높여줍니다.
STS Benchmark
MT-DNN-SMART
MRPC
BERT-Base
MTEB
AnglE-UAE
SICK
SRoBERTa-NLI-large
STS13
Trans-Encoder-BERT-large-bi (unsup.)
STS14
PromCSE-RoBERTa-large (0.355B)
STS12
PromptEOL+CSE+OPT-13B
STS15
SimCSE-RoBERTalarge
STS16
AnglE-LLaMA-13B
SentEval
Snorkel MeTaL(ensemble)
CxC
PromCSE-RoBERTa-large (0.355B)
MRPC Dev
Synthesizer (R+V)
SICK-R