Code Generation On Res Q
المقاييس
pass@1
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | pass@1 |
---|---|
res-q-evaluating-code-editing-large-language | 30.0 |
res-q-evaluating-code-editing-large-language | 58.0 |
res-q-evaluating-code-editing-large-language | 20.0 |
res-q-evaluating-code-editing-large-language | 18.0 |
res-q-evaluating-code-editing-large-language | 30.0 |
res-q-evaluating-code-editing-large-language | 36.0 |
res-q-evaluating-code-editing-large-language | 46.0 |
res-q-evaluating-code-editing-large-language | 29.0 |
res-q-evaluating-code-editing-large-language | 37.0 |