Question Similarity On Q2Q Arabic Benchmark
평가 지표
F1 score
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | F1 score |
---|---|
deep-learning-models-for-multilingual-hate | 0.8365 |
the-inception-team-at-nsurl-2019-task-8 | 0.95924 |
tha3aroon-at-nsurl-2019-task-8-semantic | 0.94848 |