HyperAIHyperAI

Command Palette

Search for a command to run...

Phi-3 技術レポート:あなたのスマートフォン上でローカルに実行可能な高機能な言語モデル

概要

本稿では、3.3兆トークンのデータセットを用いて学習された38億パラメータの言語モデル「phi-3-mini」を紹介する。このモデルは、学術的ベンチマークおよび社内評価において、Mixtral 8x7BやGPT-3.5と同等の性能を発揮しており(例:MMLUで69%、MT-benchで8.38)、スマートフォン上でも実装可能な小型化を実現している。本モデルの革新点は、phi-2で使用されたデータセットのスケーリングアップ版である学習データセットにあり、その中には厳密にフィルタリングされたウェブデータと合成データが含まれる。また、モデルは耐障害性、安全性、チャット形式への適合性をさらに高めるため、追加の調整が施されている。さらに、4.8兆トークンのデータで学習された70億パラメータ(phi-3-small)および140億パラメータ(phi-3-medium)のモデルについて、初期のパラメータスケーリングの結果も提示する。これらはいずれもphi-3-miniよりも顕著に優れた能力を有しており(MMLUではそれぞれ75%および78%、MT-benchでは8.7および8.9を達成)。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています