一般知識

一般知識タスクは、モデルが幅広い分野の質問に答える能力を評価することを目指しています。このタスクは雑多なカテゴリに属し、モデルの一般的な知識の理解と応用を系統的にテストすることで、未知の具体的なシナリオでの知識利用の熟練度を測定します。このタスクのパフォーマンス向上は、モデルの多様性と実用性を高めるために重要です。