OpenAI、ChatGPT イメージ 2.0 を発表:「推論機能」を導入し、生成コンテンツをよりリアルに
生成系 AI が継続的に進化を遂げる中で、OpenAI は画像生成能力の強化を進めています。現地時間の火曜日、同社は次世代の画像モデルである「ChatGPT Images 2.0」を正式にリリースしました。この新モデルは一定の「推論能力」を持つと説明されており、プロンプトに基づく画像生成だけでなく、ネット上の情報を用いて出力内容を「二重検証」することで、結果の妥当性と一貫性を向上させます。公式が公開したサンプルによると、このモデルは写実性や表現形式においてさらに進歩しています。例えば、一部の生成コンテンツは意図的に「スクリーンショットの中のスクリーンショット」として設計されたり、ユーザーが物理的な雑誌をめくる様子を模倣したりしており、AI による生成画像と実際の写真との境界線がいっそう曖昧になっています。サム・アルトマン氏は発表時のライブ配信で、「チームはこのモデルに対して非常に優れた成果を出している」と評価しました。機能面では、ChatGPT Images 2.0 は中国語、日本語、韓国語、ヒンディー語、ベンガル語を含む複数の言語でのプロンプト生成をサポートします。また、広告用素材、雑誌ページ、コミックなど多種多様な形式の生成が可能であり、実在する人物に対するスタイル転換もサポートしています。具体的には、著名な投資家を 1980 年代風のイメージに変換するなどです。著作権問題への懸念について、OpenAI は本モデルが特定の作品を複製または再現するものではなく、学習したパターンに基づいて生成すると表明しました。同時に、存命の芸術家の個人的なスタイルの模倣を制限しつつ、より広義のスタジオスタイルについては許可しています。これに対しミッチ・ストルツ氏は、生成されたコンテンツがトレーニングデータ内の具体的な作品と実質的に類似していない限り、一般的に著作権侵害とはみなされないとしています。しかしながら、AI 生成コンテンツがますますリアル化するにつれ、関連する議論は続いています。現在、OpenAI は『ニューヨーク・タイムズ』紙や作家ジョージ・R・R・マーティンを含む複数の著作権訴訟に直面しています。業界関係者の多くは、技術そのものは従来の画像編集ツールと同様だが、効率と規模における向上により、それによって引き起こされる社会的および法的影響が増幅されていると指摘しています。
