Command Palette
Search for a command to run...
GPT-4o システムカード
GPT-4o システムカード
概要
GPT-4o は、テキスト、音声、画像、動画の任意の組み合わせを入力として受け取り、出力もテキスト、音声、画像の任意の組み合わせを生成できる自己回帰型のオムニモデルです。このモデルは、テキスト、視覚、音声の全領域にわたりエンド・トゥ・エンドで学習されており、すべての入力と出力が同一のニューラルネットワークによって処理されます。GPT-4o は音声入力に対して最短232ミリ秒、平均320ミリ秒で応答可能であり、会話における人間の反応時間とほぼ同等です。英語のテキストおよびコード処理においては GPT-4 Turbo と同等の性能を発揮し、非英語のテキスト処理においては顕著な向上を示す一方で、API でははるかに高速かつ50%のコスト削減が実現しています。GPT-4o は、既存のモデルと比較して、特に視覚および音声の理解能力に優れています。当社がワシントンD.C.の白書に掲げた自主的コミットメントに従い、AIの安全な開発に尽力する姿勢を示すため、GPT-4o のシステムカード(System Card)を公開しました。このシステムカードでは、GPT-4o の機能、制限、安全性評価を、音声対音声(speech-to-speech)を中心に、テキストおよび画像処理能力の評価、安全で整合性のある運用を確保するための対策を含め、多角的に詳細に紹介しています。また、危険な能力に関する第三者機関による評価も併記し、GPT-4o のテキストおよび視覚処理機能が社会に与える可能性のある影響についても検討を加えています。