HyperAI超神経
Back to Headlines

Black Forest Labs、12億パラメータの上下文感知型画像編集モデル FLUX.1 Kontext [dev] をオープンソース化

3日前

Black Forest Labs、オープンソース画像編集モデル「FLUX.1 Kontext [dev]」を発表 Black Forest Labsは、新世代の画像編集モデル「FLUX.1 Kontext [dev]」をオープンソース化し、AIコミュニティに大きな反響を呼んでいることを発表しました。このモデルは、FLUX.1シリーズの最新作として注目を集め、その優れた画像編集能力と高いパフォーマンスにより、GPT-4の競合モデルとして位置付けられています。 FLUX.1 Kontext [dev] は12億のパラメータを持つストリームマッチングトランスフォーマーを採用しており、消費グレードのハードウェアでも動作可能な設計となっています。これにより、クリエイターや開発者、研究者らが柔軟に利用できるようになるため、様々なアプリケーションで活用の可能性が広がります。 コア機能:コンテクスト感知と精密編集 FLUX.1 Kontext [dev] の最大の特徴は、テキストと画像の両方を理解するコンテクスト感知機能です。従来の単純なテキストベースの画像生成とは異なり、ユーザーは簡単なテキスト指令で既存の画像を編集できます。特定の領域の色やスタイル、背景を変更しながら、キャラクターやオブジェクトのスタイルの一貫性を保つことができます。また、複数回の反復編集に対応しており、視覚的なズレを最小限に抑え、画像の品質と一致性を確保します。 オープンソースによるコミュニティの革新 このモデルは非商業ライセンスのもとで公開されており、前のFLUX.1 [dev]の推論コードと互換性があります。研究人员やアーティストが個人、研究、特定の商業シーンで自由に利用可能です。Black Forest Labsは、指導蒸留技術を用いて効率を大폭向上させ、カスタマイズ可能な開発を可能にしたことによって、コミュニティの创新を支援しています。AIbaseによると、モデルはReplicateやHugging Faceなどの複数のプラットフォームで利用可能となり、コミュニティの開発者が芸術制作やコンテンツ生成における新たな用途を探っている。 責任あるAI開発 Black Forest Labsは、生成AIの開発において責任感を重んじています。FLUX.1 Kontext [dev] の公開前に、データフィルタリングやInternet Watch Foundationとの連携を通じて不適切なコンテンツ生成のリスクを軽減しました。さらに、出力データにはC2PA標準に基づく暗号化署名メタデータが付加され、コンテンツの追跡が可能です。同社はAPIを使用状況を監視し、ポリシー違反の防止にも取り組んでいます。 業界への影響と今後の展開 FLUX.1 Kontext [dev] の公開は、画像編集分野にとって重要な Milestone となります。AIbaseは、その高速な反復編集能力和消費级别ハードウェアへの対応が、プロフェッショナルな画像編集のハードルを大幅に下げることを見込んでいます。これはオープンソースコミュニティを活性化させ、閉ソースモデルに対抗することにつながるでしょう。今後、Black Forest Labsはさらにモデルの最適化を行い、テキストから動画の生成へと技術の拡張を目指す予定です。生成AI分野に新たな活力をもたらすことが期待されています。 オープンソース: https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev GitHub: https://github.com/black-forest-labs/flux

Related Links