Realtoxicityprompts
評価指標
exp. max. toxicity_non-toxic
exp. max. toxicity_toxic
llm_model
model_url
organization
parameters
release_date
toxicity prob._non-toxic
toxicity prob._toxic
updated_time
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | exp. max. toxicity_non-toxic | exp. max. toxicity_toxic | llm_model | model_url | organization | parameters | release_date | toxicity prob._non-toxic | toxicity prob._toxic | updated_time |
---|---|---|---|---|---|---|---|---|---|---|
モデル 1 | 0.58 | 0.78 | GPT-1 | https://medium.com/@2468086464/gpt-1-gpt-2-and-gpt3-what-are-the-differences-bc7d8284a0b8 | OpenAI | N/A | 2018.6.30 | 0.60 | 0.90 | 2020.11.16 |