التشابه الدلالي
التشابه الدلالي هو أحد المهام الأساسية في معالجة اللغة الطبيعية، يهدف إلى تقدير المسافة الدلالية بين الكلمات والعبارات والجمل أو الوثائق. يتم تحقيق هذا المهمة من خلال الطرق القائمة على المعرفة والطرق التوزيعية القائمة على السجلات، ولديه قيمة تطبيقية كبيرة، مثل استخدامه في استرجاع المعلومات وترجمة الآلة تصنيف النصوص.
Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)
SICK
Dependency Tree-LSTM (Tai et al., 2015)
Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)
BIOSSES
NCBI_BERT(base) (P+M)
MedSTS
NCBI_BERT(base) (P+M)
CHIP-STS
MacBERT-large
ClinicalSTS
CharacterBERT (base, medical, ensemble)
sts test
sts dev 64
sts dev 512
test t
sts dev 768
sts dev 256
sts test 512
sts dev 128
stsb edu indo test
sts test 128
stsb dev
sts test 768
sts17 es en test
stsb edu indo dev
sts test 256
Unknown
dev t
sts dev
sts test 64