Boundary Detection On Coauthor
Métriques
Cohen’s Kappa score
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Cohen’s Kappa score |
---|---|
gigacheck-detecting-llm-generated-content | 0.4158 |
gigacheck-detecting-llm-generated-content | 0.1885 |
towards-detecting-ai-generated-text-within | 0.4002 |