Boundary Detection On Coauthor
평가 지표
Cohen’s Kappa score
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Cohen’s Kappa score |
---|---|
gigacheck-detecting-llm-generated-content | 0.4158 |
gigacheck-detecting-llm-generated-content | 0.1885 |
towards-detecting-ai-generated-text-within | 0.4002 |