Command Palette

Search for a command to run...

4ヶ月前

Claude 3.5 Sonnet Model Card 増補資料

{Anthropic}

Claude 3.5 Sonnet Model Card 増補資料

要約

本補足資料は、Claude 3 Model Card の一部として、従来の最高性能モデルである Claude 3 Opus を上回る性能を発揮し、かつより高速かつ低コストで動作する新モデル「Claude 3.5 Sonnet」について説明するものである。Claude 3.5 Sonnet は、より優れたコーディング能力および視覚処理能力を備えており、Claude 3 モデルシリーズの進化版として位置づけられる。そのため、新たなモデルカードの作成ではなく、本補足資料の提供にとどめている。本資料では、最新の主要評価結果および安全性試験の成果を更新して示している。

ベンチマーク

ベンチマーク方法論指標
code-generation-on-humanevalGPT-4o (0-shot)
Pass@1: 90.2
mmr-total-on-mrr-benchmarkClaude 3.5 Sonnet
Total Column Score: 463
multi-task-language-understanding-on-mmluClaude 3.5 Sonnet (5-shot)
Average (%): 88.7
question-answering-on-newsqaAnthropic/claude-3-5-sonnet
EM: 74.23
F1: 82.3
visual-question-answering-on-mm-vetClaude 3.5 Sonnet (claude-3-5-sonnet-20240620)
GPT-4 score: 74.2±0.2
visual-question-answering-on-mm-vet-v2Claude 3.5 Sonnet (claude-3-5-sonnet-20240620)
GPT-4 score: 71.8±0.2

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Claude 3.5 Sonnet Model Card 増補資料 | 論文 | HyperAI超神経