HyperAI

Boundary Detection On Coauthor

Métriques

Cohen’s Kappa score

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleCohen’s Kappa score
gigacheck-detecting-llm-generated-content0.4158
gigacheck-detecting-llm-generated-content0.1885
towards-detecting-ai-generated-text-within0.4002