HyperAI超神経
Back to Headlines

Gemini 2.5 Flash-Liteが一般公開、高速かつ低コストなモデルに

3日前

グーグルが、Gemini 2.5 Flash-Liteの安定版を一般公開した。このモデルは、Gemini 2.5シリーズの中で最も高速でコストが低いもので、入力100万トークンあたり0.1ドル、出力は0.4ドルと設定されている。Gemini 2.5 Flash-Liteは、コストパフォーマンスの向上を目指して開発され、高負荷な用途では論理的思考機能をオプションで有効にできる。2.5 Proと2.5 Flashに続くこのモデルは、本格的な拡大生産に向けた準備が整っている。 性能とコストのバランスが特徴で、特に遅延に敏感なタスク、例えば翻訳や分類に適している。高速性、コスト効率、質の高さを兼ね備えており、コード作成、数学、科学、推論、マルチモーダル理解のベンチマークでも、2.0 Flash-Liteを上回る成果を示している。また、100万トークンのコンテキスト窓や、Google検索による情報検証、コード実行、URLのコンテキストサポートなどの機能も備えている。 実際の導入事例として、Satlytは宇宙データの処理を効率化し、45%の遅延削減と30%の電力消費削減を実現した。HeyGenはAIアバターを活用し、180以上の言語への自動翻訳を可能にした。DocsHoundは長時間の動画を迅速に処理し、スクリーンショットを大量に抽出してドキュメント化する。EvertuneはAIモデルの表現を分析し、迅速なレポート作成を可能にしている。 現在、コード内で「gemini-2.5-flash-lite」と指定することで利用可能。プレビュー版を使用している場合は、このモデルに切り替えることができる。8月25日からはプレビューのエイリアスが削除される予定。Google AI StudioやVertex AIで、今すぐ安定版を試すことができる。

Related Links