Similarité sémantique
La similarité sémantique est l'une des tâches fondamentales en traitement automatique des langues naturelles, visant à quantifier la distance sémantique entre des mots, des phrases, des sentences ou des documents. Cette tâche est réalisée grâce à des méthodes basées sur les connaissances et des méthodes de distribution basées sur des corpus, et elle présente une valeur d'application importante, notamment dans la recherche d'information, la traduction automatique et la classification de texte.
SICK
Dependency Tree-LSTM (Tai et al., 2015)
Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)
Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)
BIOSSES
NCBI_BERT(base) (P+M)
CHIP-STS
MacBERT-large
ClinicalSTS
CharacterBERT (base, medical, ensemble)
MedSTS
NCBI_BERT(base) (P+M)
dev t
sts dev
sts dev 128
sts dev 256
sts dev 512
sts dev 64
sts dev 768
sts test
sts test 128
sts test 256
sts test 512
sts test 64
sts test 768
sts17 es en test
stsb dev
stsb edu indo dev
stsb edu indo test
test t
Unknown