LLM : des modèles moyens
Une étude récente menée par des chercheurs de l’Université du Maryland et de Google DeepMind, intitulée StoryScope, met en lumière les limites créatives des grands modèles de langage. En analysant plus de soixante mille nouvelles, les scientifiques ont démontré que les IA génératives privilégient systématiquement les choix narratifs les plus probables, produisant des récits marqués par une forte convergence et une absence d’ambiguïté. Pour éviter les biais liés au style, souvent modifiés par les mises à jour des modèles, l’équipe a développé une méthodologie basée sur 304 caractéristiques structurelles et narratives. Les résultats confirment que les IA évitent les intrigues secondaires, résolvent systématiquement les tensions et expliquent explicitement la morale dans sept cas sur dix. À l’inverse, les auteurs humains introduisent naturellement des retours en arrière, des fins ouvertes et laissent le lecteur interpréter les émotions ou les sous-entendus. Les modèles génèrent également les sentiments par des descriptions corporelles plutôt que par leur nom, montrant une tendance à sur-expliquer pour compenser une confiance réduite dans la perception du lecteur. La convergence des modèles est frappante. Malgré des architectures et des ensembles d’entraînement différents, les cinq systèmes testés s’agrègent dans une zone narrative étroite et centrale. Les récits humains, quant à eux, restent dispersés et ont été classés comme les plus rares dans plus de cinquante-sept pour cent des cas. Cette étude souligne également les limites des détecteurs d’IA basés sur le style, qui voient leur efficacité chuter drastiquement lorsque les modèles ajustent leur ponctuation ou leurs tournures caractéristiques. L’analyse structurelle apparaît comme une méthode beaucoup plus fiable pour distinguer les productions humaines des générations automatisées. Ces constats révèlent une différence fondamentale dans le processus créatif. Là où l’intelligence artificielle calcule la moyenne statistique des textes existants, l’écriture humaine exploite l’imprévu, la complexité temporelle et l’ambiguïté comme ressorts narratifs. Bien que chaque modèle conserve de légères particularités, leur tendance globale reste alignée sur un récit standardisé. Cette recherche offre aux développeurs et aux éditeurs un cadre plus robuste pour évaluer la génération textuelle, tout en rappelant que la singularité humaine réside précisément dans sa capacité à s’éloigner de la probabilité moyenne.
