HyperAI
HyperAI超神経
ホーム
ニュース
最新論文
チュートリアル
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
日本語
HyperAI
HyperAI超神経
Toggle sidebar
サイトを検索…
⌘
K
ホーム
SOTA
コード生成
Code Generation On Res Q
Code Generation On Res Q
評価指標
pass@1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
Columns
モデル名
pass@1
Paper Title
Repository
QurrentOS-coder + Gemini 1.5 Pro
30.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + Claude 3.5 Sonnet
58.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + Llama 3 70b
20.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + Qwen-72B-Instruct
18.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + GPT-4
30.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + Claude 3 Opus
36.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + GPT-4o
46.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + DeepSeek-Coder-V2
29.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
QurrentOS-coder + GPT-4 Turbo
37.0
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale
-
0 of 9 row(s) selected.
Previous
Next
Code Generation On Res Q | SOTA | HyperAI超神経