8ヶ月前

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

Dan Hendrycks Collin Burns Saurav Kadavath Akul Arora Steven Basart Eric Tang Dawn Song Jacob Steinhardt

概要

多くの知的活動が数学的な問題解決を必要とする一方で、このスキルはコンピュータの能力を超えたものである。機械学習モデルにおけるこの能力を測定するために、我々は12,500問の難易度の高い競技数学問題からなる新しいデータセットMATHを導入する。MATHの各問題には、ステップバイステップの完全な解説が付いており、これを使用してモデルに解答の導出過程と説明を生成させることが可能である。将来の研究を促進し、MATHでの精度を向上させるために、数学の基礎を教えるのに役立つ大規模な補助的な事前学習データセットも提供する。巨大なトランスフォーマー・モデルを使用しても、MATHでの精度は依然として相対的に低いという結果を得ている。さらに、スケーリング傾向が続く場合、単に予算やモデルパラメータ数を増やすだけでは強力な数学的推論を達成することは現実的ではないことがわかった。トランスフォーマーのスケーリングが他のテキストベースのタスクの大半を自動的に解決しているにもかかわらず、現在のところスケーリングはMATHを解決していない。数学的な問題解決においてより大きな進展を得るためには、広範な研究コミュニティからの新たなアルゴリズム的な進歩が必要となる可能性が高い。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

Dan Hendrycks Collin Burns Saurav Kadavath Akul Arora Steven Basart Eric Tang Dawn Song Jacob Steinhardt

概要

多くの知的活動が数学的な問題解決を必要とする一方で、このスキルはコンピュータの能力を超えたものである。機械学習モデルにおけるこの能力を測定するために、我々は12,500問の難易度の高い競技数学問題からなる新しいデータセットMATHを導入する。MATHの各問題には、ステップバイステップの完全な解説が付いており、これを使用してモデルに解答の導出過程と説明を生成させることが可能である。将来の研究を促進し、MATHでの精度を向上させるために、数学の基礎を教えるのに役立つ大規模な補助的な事前学習データセットも提供する。巨大なトランスフォーマー・モデルを使用しても、MATHでの精度は依然として相対的に低いという結果を得ている。さらに、スケーリング傾向が続く場合、単に予算やモデルパラメータ数を増やすだけでは強力な数学的推論を達成することは現実的ではないことがわかった。トランスフォーマーのスケーリングが他のテキストベースのタスクの大半を自動的に解決しているにもかかわらず、現在のところスケーリングはMATHを解決していない。数学的な問題解決においてより大きな進展を得るためには、広範な研究コミュニティからの新たなアルゴリズム的な進歩が必要となる可能性が高い。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています