HyperAI

一般知識タスクは、モデルが幅広い分野の質問に答える能力を評価することを目指しています。このタスクは雑多なカテゴリに属し、モデルの一般的な知識の理解と応用を系統的にテストすることで、未知の具体的なシナリオでの知識利用の熟練度を測定します。このタスクのパフォーマンス向上は、モデルの多様性と実用性を高めるために重要です。

BIG-bench

HyperAI

BIG-bench

Command Palette

一般知識

Command Palette

一般知識

Command Palette

一般知識