HyperAI

Dans le contexte de l'évolution continue de l'IA générative, OpenAI renforce ses capacités en matière de génération d'images. Mardi local, la société a officiellement lancé ChatGPT Images 2.0 ; ce nouveau modèle d'image est décrit comme possédant une certaine « capacité de réflexion », capable non seulement de générer des images à partir de prompts mais également d'utiliser les informations disponibles sur Internet pour effectuer un « second contrôle » des sorties afin d'améliorer leur pertinence et leur cohérence. D'après les exemples présentés par l'entreprise, le modèle affiche une amélioration tant du réalisme que des modes d'expression. Par exemple, certains contenus générés sont délibérément conçus sous forme de « captures d'écran dans une capture d'écran » ou simulent des scènes où un utilisateur feuilleterait un magazine physique, rendant ainsi la frontière entre les images produites par l'IA et les photographies réelles encore plus floue. Lors du direct de lancement, Sam Altman a déclaré : « L'équipe s'est surpassée avec ce modèle. ». Sur le plan fonctionnel, ChatGPT Images 2.0 prend en charge la génération via des prompts multilingues incluant le chinois, le japonais, le coréen, l'hindi et le bengali. Le modèle peut produire divers formats tels que des supports publicitaires, des pages de magazines et des bandes dessinées, tout en permettant la recréation stylisée de personnalités publiques, comme transformer un investisseur connu en personnage au style années 1980. Concernant les questions de droits d'auteur qui suscitent l'intérêt extérieur, OpenAI précise que le modèle ne copie ni ne reproduit des œuvres spécifiques, mais qu'il se fonde sur des motifs appris lors de son entraînement. La société interdit toutefois l'imitation directe du style personnel d'artistes vivants, tout en autorisant la création inspirée de styles d'étudio plus généraux. À cet égard, Mitch Stoltz souligne que tant que le contenu généré n'existe pas de similarité substantielle avec des œuvres concrètes présentes dans les données d'apprentissage, il ne constitue généralement pas une violation du droit d'auteur. Toutefois, alors que les contenus produits par l'IA deviennent de plus en plus réalistes, les controverses persistent actuellement. OpenAI fait face à plusieurs poursuites judiciaires liées aux droits d'auteur, notamment celles intentées par The New York Times et par l'écrivain George R. R. Martin. Les observateurs du secteur considèrent globalement que, bien que la technologie elle-même ressemble aux outils traditionnels de retouche d'images, l'accroissement significatif de sa productivité et de son échelle tend à amplifier les impacts sociaux et juridiques associés.

Liens associés

Liens associés

Liens associés

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.

Command Palette

OpenAI lance ChatGPT Images 2.0 : introduction d'une « capacité de réflexion » pour des contenus générés plus réalistes

Liens associés

Command Palette

OpenAI lance ChatGPT Images 2.0 : introduction d'une « capacité de réflexion » pour des contenus générés plus réalistes

Liens associés

Command Palette

OpenAI lance ChatGPT Images 2.0 : introduction d'une « capacité de réflexion » pour des contenus générés plus réalistes

Liens associés

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.

ByteDance Met En Open Source Lance, Un Modèle 3B Englobant La Compréhension, La Génération Et l'édition ; l'Université Nationale De Singapour Propose l'ensemble De Données ViMU : Couvrant 588 Vidéos Et Des Réponses À Des Questions Non verbales.