HyperAIHyperAI

Command Palette

Search for a command to run...

Metaが公開するLlama 4の全貌:マルチモーダル対応で進化、開発者向けツールも拡充

Metaが開発する「Llama」は、オープンな性質を持つ大規模生成AIモデルのファミリーであり、開発者が自由にダウンロード・利用できる点が特徴。他の大手企業のモデル(例:GoogleのGemini、OpenAIのChatGPT)がAPI経由でのみ利用可能であるのに対し、Llamaはコードやデータの改変・カスタマイズが容易で、開発者に高い自由度を提供している。2025年4月にリリースされた最新バージョン「Llama 4」は、3つのモデルから構成される。うち「Scout」は1000万トークンの長文処理が可能で、約80冊の小説分の文書を一度に処理でき、大規模なデータ分析に適している。「Maverick」は100万トークンの文脈窓を持ち、コード生成やチャットボット用途に最適。一方「Behemoth」は16の専門エキスパートを備えた「Mixture-of-Experts(MoE)」アーキテクチャで、高度な研究やモデルの蒸留に活用される。これらのモデルは、テキスト・画像・動画のマルチモーダル入力をサポートし、200言語に対応している。 Llamaは、AWS、Google Cloud、Microsoft Azureなど25以上のクラウドプラットフォームでホスト可能。また、Hugging FaceやNvidia、Databricksなどとの連携により、開発者はモデルの微調整や評価に使えるツールやライブラリも入手できる。Metaは「Llama for Startups」というプログラムを立ち上げ、新興企業に技術支援と資金支援を提供している。 安全性面では、Llama GuardやPrompt Guard、Llama Firewall、Code Shieldといったツール群が、有害なコンテンツやプロンプトインジェクション、不正なコード生成を検出・防止する。また、CyberSecEvalというベンチマークにより、AIが社会的誘導やサイバー攻撃に使われるリスクを評価できる。 ただし、Llamaには限界もある。英語以外のマルチモーダル対応はまだ限定的。また、著作権問題では、元々の訓練データに違法に配布された電子書籍が使われており、裁判で「フェアユース」と判断されたが、生成された内容が著作権侵害にあたる可能性は残る。特にコード生成では、LiveCodeBenchで40%の正解率にとどまり、GPT-5やGrok 4に大きく劣る。誤った情報やセキュリティ上のリスクを含むコードを生成する可能性があるため、必ず人間によるレビューが必要。また、感情的な会話や法律的助言などでも、信憑性のない内容を「ありそうな」形で提示する傾向がある。 Llamaは強力なオープンソースAIの基盤だが、活用には技術的・倫理的な注意が不可欠である。

関連リンク