Pourquoi une IA plus rapide n'est pas toujours meilleure
Dans la course à la vitesse des modèles d'intelligence artificielle, la latence, c'est-à-dire le délai avant l'affichage d'une réponse, est souvent considérée comme une contrainte purement technique à minimiser. Cependant, une étude récente présentée à la conférence CHI 2026 de Barcelone remet en question l'idée selon laquelle une vitesse de réponse plus rapide est toujours synonyme d'une meilleure expérience utilisateur. Les chercheurs Felicia Fang-Yi Tan et Oded Nov, professeur de gestion technologique et d'innovation, ont dirigé une expérience impliquant 240 participants chargés d'accomplir des tâches de travail cognitif via un chatbot. L'objectif était d'examiner comment le temps de réponse influence l'utilisation et l'évaluation des systèmes d'IA. Contrairement aux systèmes déterministes traditionnels où le résultat est prévisible, les modèles d'IA sont probabilistes et leurs réponses ne peuvent être anticipées avec certitude. Leurs interfaces conversationnelles incitent les utilisateurs à projeter des signes sociaux humains sur la machine, interprétant parfois un silence comme un signe de réflexion. Les participants ont été répartis en différents groupes recevant des réponses après deux, neuf ou vingt secondes de délai. Les tâches variaient entre la création de contenu, comme le brainstorming ou la rédaction, et la recherche de conseils, tels que l'évaluation de décisions. Les résultats ont révélé que le temps de réponse n'avait pas d'impact significatif sur le comportement réel des utilisateurs, tels que la fréquence des requêtes ou la fréquence des interactions. Les échanges étaient davantage dictés par la nature de la tâche que par la vitesse du système. Les tâches de création ont conduit à des itérations plus fréquentes pour affiner les idées, tandis que les tâches de conseil ont généré des échanges plus ciblés et courts. Cependant, le temps de réponse a eu un effet considérable sur la perception de l'intelligence de l'IA. Les utilisateurs ayant reçu des réponses quasi instantanées (deux secondes) ont systématiquement évalué les réponses comme étant moins réfléchies et moins utiles. À l'inverse, ceux qui ont attendu davantage de temps, même avec le même contenu, ont jugé les réponses plus favorables. Ils interprétaient le délai comme un signe que le système était en train de "réfléchir", lui attribuant ainsi plus de soin et de délibération. Ce phénomène met en lumière une caractéristique subtile mais puissante de la psychologie humaine : dans la conversation quotidienne, les pauses ont du sens. Une réponse rapide peut paraître impulsive, tandis qu'un délai mesuré suggère une réflexion profonde. Les utilisateurs transfèrent ces attentes sociales aux machines, indépendamment de leur connaissance du fonctionnement technique sous-jacent. Ces découvertes soulèvent des implications dépassant la simple expérience utilisateur. Plutôt que de chercher à éliminer toute latence, les concepteurs devraient se demander comment elle peut être exploitée intentionnellement. Le concept de "friction positive" propose des ralentissements délibérés visant à promouvoir des bénéfices cognitifs tels que la réflexion, transformant chaque milliseconde d'attente en une opportunité plutôt qu'en un gaspillage. Enfin, l'étude invite à une réflexion éthique importante. Si les utilisateurs associent automatiquement des temps de réponse plus longs à une meilleure qualité, ils pourraient accorder une confiance excessive à des systèmes lents, même si leurs sorties ne sont pas objectivement supérieures. Cela soulève la question de savoir si les systèmes d'IA doivent être conçus pour manipuler la perception de leur vitesse et, le cas échéant, si les utilisateurs doivent être informés de ces stratégies de design.
