Le Ministère Des Sciences Et De La Technologie Passe À L'action ! Le Manuel D'utilisation De L'aigc Pour Les Chercheurs Est Disponible, Et La Communauté Universitaire Commence À Se Protéger Contre Les Hommes Armés De L'ia

Le Département de supervision du ministère des Sciences et de la Technologie a publié les « Lignes directrices pour une conduite responsable de la recherche (2023) », qui tracent clairement des lignes rouges pour les questions brûlantes qui préoccupent la société, telles que l'intelligence artificielle et la publication de résultats majeurs.
Falsification de données expérimentales, falsification d'images expérimentales, signature incorrecte de documents, plagiat dans la rédaction de manuels scolaires... Dans l'après-midi du 16 janvier, 11 étudiants de l'Université agricole de Huazhong ont déposé une plainte avec un rapport de 125 pages selon lequel le professeur Huang de l'école s'était livré à une faute académique. Pendant un certain temps, l’opinion publique a rapidement fermenté et des contenus connexes tels que « parier sur son avenir pour défendre son innocence académique » et « tout le monde est victime de fraude académique » ont suscité des discussions animées sur les principales plateformes.
Certains internautes ont associé cela à un précédent article frauduleux sur la maladie d'Alzheimer. Cet article de Nature, cité plus de 2 300 fois, a induit en erreur la recherche mondiale sur la maladie d’Alzheimer pendant 16 ans.
Si vous vous concentrez sur la recherche de la vérité, votre art ne sera pas parfait. Au cours des cent dernières années, l’esprit d’intégrité académique et la noble conviction du bienfait pour l’humanité ont été le guide qui a guidé les étudiants pour continuer à avancer sur la voie de la recherche scientifique. Mais aujourd’hui, elle est mêlée à de plus en plus de tentations de gloire et de fortune, ce qui entraîne une fraude académique qui ne peut être stoppée malgré des interdictions répétées. Surtout avec le développement rapide de technologies telles que l’IA et les grands modèles, les technologies émergentes sont devenues des « complices » de la tricherie dans la recherche scientifique. Cela est non seulement injuste pour les chercheurs qui insistent pour étudier, mais les fausses données de recherche peuvent également avoir de graves conséquences.
Par conséquent, tout en enquêtant strictement sur la fraude académique, il est également très important de réglementer l’application de technologies telles que l’IA dans la recherche scientifique.
Établir des limites claires et utiliser l’intelligence artificielle générative de manière raisonnable, conformément à la réglementation
La fraude aux documents universitaires a une longue histoire. En plus des méthodes conventionnelles telles que le plagiat et la fabrication de données, il est également courant de payer des écrivains, d'utiliser des « usines à papier » pour écrire à votre place et de fabriquer des articles.
De nos jours, la technologie d'intelligence artificielle générative représentée par ChatGPT (AIGC) est sorti de nulle part et a fourni aux gens de nouvelles aides pour la rédaction de documents. De la sélection des sujets au polissage des manuscrits, de l'analyse statistique à la production de graphiques... ses puissantes fonctions couvrent presque tous les aspects du processus de rédaction de documents universitaires et peuvent en effet aider les chercheurs scientifiques à effectuer rapidement la recherche documentaire, le traitement des données, le polissage des traductions et d'autres tâches.
Mais tout a deux côtés. Si les chercheurs considèrent les textes générés par l’AIGC comme leurs propres créations, cela créera en grande partie une « bulle académique » sans valeur. En outre, une dépendance excessive à l’égard de l’AIGC pour produire des résultats de recherche peu fiables réduira considérablement la crédibilité de la recherche scientifique.
21 décembre 2023Le Département de supervision du ministère des Sciences et de la Technologie a publié les « Lignes directrices sur la conduite responsable de la recherche (2023) » (ci-après dénommées «Lignes directrices》),Des lignes rouges claires ont été tracées pour les questions brûlantes d’intérêt public telles que l’intelligence artificielle et la publication de réalisations majeures.

Dans la partie relative à la sélection et à la mise en œuvre des sujets de recherche, les « Lignes directrices » précisent que les documents de candidature aux projets de recherche soumis par les chercheurs scientifiques doivent être vrais, précis et objectifs. La soumission répétée du même contenu de recherche ou d'un contenu similaire n'est pas autorisée, et d'autres personnes ne doivent pas être répertoriées comme membres de l'équipe de recherche sans consentement. Vous n'êtes pas autorisé à plagier, acheter, vendre ou rédiger des documents de candidature au nom d'autrui.L’intelligence artificielle générative ne peut pas être utilisée pour générer directement des documents de candidature.
Nous devons nous conformer aux lois, réglementations et normes académiques en vigueur, et utiliser l’intelligence artificielle générative de manière raisonnable pour traiter le texte, les données ou les images académiques conformément à la réglementation afin de prévenir les risques tels que la falsification et la falsification des données.

En termes de citations de littérature, les « Lignes directrices » stipulent également clairement que le contenu généré à l'aide de l'intelligence artificielle générative, en particulier ceux impliquant du contenu clé tel que des faits et des opinions, doit être clairement marqué et le processus de génération doit être expliqué pour garantir l'authenticité et l'exactitude et le respect des droits de propriété intellectuelle d'autrui. Les contenus marqués par d'autres auteurs comme générés par l'IA ne doivent généralement pas être cités comme documents originaux, et s'ils doivent être cités, cela doit être indiqué.Les références non vérifiées générées par l'IA générative ne peuvent pas être utilisées directement.
Les « Lignes directrices » clarifient les limites de l’utilisation raisonnable de l’IA générative en termes de mise en œuvre de la recherche, de gestion des données, de rédaction et de publication des résultats, ainsi que de citations de la littérature. Ils sont d’une grande importance pour protéger la crédibilité et les principes éthiques de la recherche scientifique et contribuent à prévenir l’utilisation irresponsable de l’IA générative et des technologies associées.
Des revues nationales et étrangères renommées réglementent les articles générés par l'IA
La fraude aux documents universitaires est un problème mondial. L’émergence de l’IA générative a abaissé dans une certaine mesure le seuil de fraude. La capacité des chatbots tels que ChatGPT à « mentir sérieusement et à se justifier » a apporté du confort à ces personnes. Cependant, à mesure que les limites de l’utilisation de l’AIGC deviennent de plus en plus claires, en plus de clarifier les réglementations juridiques, de plus en plus d’institutions universitaires nationales et étrangères sont parvenues à un consensus et ont commencé à faire face à l’utilisation de l’IA et à la réglementer.
De nombreuses revues nationales ont publié des déclarations visant à restreindre les différentes manières dont les contributeurs peuvent utiliser l’IA dans le processus de rédaction de leurs articles. Des revues telles que « Journal of Jinan University », « Journal of Documentation and Data », « China Science and Technology Journal Research », « Think Tank Theory and Practice » et « Library and Information Work » ont toutes publié des déclarations affirmant queSi le contenu principal du document est généré à l’aide d’outils d’IA, une fois découvert, il sera traité comme une faute académique.
Les revues universitaires étrangères ont également commencé à réglementer l’application de l’IA dans la rédaction d’articles. Selon des statistiques incomplètes, Nature, Cell, The Lancet, JAMADes revues de premier plan telles que le Journal of the American Medical Association ont publié des déclarations indiquant :L’intelligence artificielle ne remplit pas les conditions requises pour la paternité d’un article, et les chercheurs qui l’utilisent doivent l’indiquer dans leurs manuscrits.
Utiliser l'IA pour vaincre l'IA et découvrir les « hommes armés » du journal
Pour favoriser le bon développement de l’IA, nous devons utiliser des moyens techniques efficaces. Il convient de noter qu’au niveau actuel de la technologie, les articles générés par l’IA sont similaires dans leur forme aux articles originaux, et les outils traditionnels de comparaison de similarité de texte peuvent ne pas être en mesure de les détecter avec précision. Par conséquent, les chercheurs nationaux et étrangers étudient le développement d’outils de détection spécifiquement pour l’AIGC.
« L'idée principale de l'identifiant de contenu généré par l'IA est de créer d'abord un ensemble de données de formation contenant du contenu réel et du contenu généré par l'IA, puis de former un classificateur pour faire la distinction entre ces deux types de contenu », a expliqué Tang Jian, un célèbre universitaire chinois à l'Institut de recherche MILA, dans une interview avec les médias.
Plus précisément, les modèles linguistiques de l’IA fonctionnent en prédisant et en générant un mot à la fois. Après avoir généré un mot, l'algorithme de filigrane divise aléatoirement le vocabulaire du modèle de langage en une « liste verte » et une « liste rouge », puis invite le modèle à sélectionner des mots sur la « liste verte ». Plus un article contient de mots dans la liste verte, plus il est probable que le texte ait été généré par une machine ; Les textes écrits par des humains ont tendance à contenir davantage de combinaisons aléatoires de mots.
En termes simples,La technologie de détection AIGC « utilise l’IA pour vaincre l’IA ».En nous appuyant sur des quantités massives d'échantillons de textes et de données, nous pouvons identifier les différences entre les humains et les outils AIGC en termes de longueur moyenne des phrases, de diversité du vocabulaire et de longueur du texte, identifiant ainsi les « hommes armés » des articles d'IA.
Cependant, il existe quelques difficultés techniques derrière tout cela. Par exemple, le modèle de langage est formé avec du texte créé par l’homme. Plus le nombre de paramètres est élevé, plus on se rapproche de la création humaine et plus il est difficile de la distinguer. De plus, la détection est également limitée par la longueur du texte. La précision de la détection ne peut être garantie que si le texte est suffisamment long.
Utilisation raisonnable de l’IA dans la recherche scientifique : ne pas jeter le bébé avec l’eau du bain
L'IA pour la science L'application réussie de a, dans une certaine mesure, « sauvé » les chercheurs scientifiques du travail de traitement de textes et de données, leur permettant de se concentrer davantage sur la recherche elle-même, ce qui peut améliorer l'efficacité et accélérer dans une certaine mesure les progrès de la recherche scientifique. De plus, l’intelligence artificielle n’est pas non plus inférieure à la capacité d’explorer complètement certains contenus de recherche scientifique approfondis et complexes.
Par exemple, les modèles prédictifs qui ont reçu beaucoup d’attention dans le domaine de la recherche médicale ces dernières années ont laissé certains nouveaux chercheurs perplexes. L’IA peut progressivement établir des idées et des méthodes pour aider les chercheurs à construire rapidement un modèle qualifié.
Par exemple, en termes de conception et d’optimisation expérimentales, l’IA peut générer des plans expérimentaux détaillés en fournissant simplement des informations telles que le but, les méthodes et les matériaux de l’expérience, aidant ainsi les chercheurs scientifiques à évaluer et à optimiser les plans existants et à réduire les coûts expérimentaux.
En conclusion,Nous ne devons pas avoir peur de l’intelligence artificielle générative, mais la réguler et la guider afin qu’elle puisse servir la recherche scientifique dans la bonne voie.Pour les chercheurs scientifiques, il est nécessaire de faire bon usage de la technologie de l’IA et de tirer parti de ses avantages pour mener à bien et avec précision des recherches scientifiques et la rédaction d’articles. Cependant, toutes les opinions et données doivent être examinées par l’auteur pour éviter certaines conclusions fausses et fabriquées de l’IA générative afin de maintenir la dignité de la science.
En fait, c’est exactement l’intention initiale de l’IA pour la science, qui est d’utiliser l’IA pour remodeler et innover les paradigmes de recherche scientifique traditionnels.Aujourd’hui, l’IA pour la science a réalisé des mises à niveau dans de nombreux domaines tels que la biomédecine, la chimie des matériaux, les mathématiques, la physique, etc., et a créé un certain nombre de résultats importants ayant une valeur d’application pratique. Cependant, de nombreux chercheurs restent dans l’expectative. D’une part, il peut y avoir un manque d’outils d’IA à bas seuil dans leurs domaines ; d’un autre côté, ils n’ont peut-être pas encore trouvé l’intersection entre l’IA et leurs domaines de recherche.
Le voyage d’exploration de l’IA pour la science ne fait que commencer. Ce n’est que lorsque la recherche scientifique et l’IA iront de pair que nous pourrons créer des outils et des méthodes plus universels.