Voici une pensée inconfortable pour chaque établissement universitaire qui utilise actuellement des détecteurs d'IA pour contrôler les soumissions des étudiants et des chercheurs : les outils ne fonctionnent pas de manière aussi fiable que le supposent les établissements.
Un article présenté cette semaine au Symposium IEEE 2026 sur la sécurité et la confidentialité par des chercheurs de l'Université de Floride conclut que les détecteurs de texte générés par l'IA disponibles dans le commerce sont « mal adaptés au déploiement dans des contextes universitaires ou à enjeux élevés ».
C'est une façon polie de dire que les universités prennent des décisions de changement de carrière basées sur les résultats d'outils qui sont fondamentalement peu fiables.
Qu’a réellement révélé la recherche ?
Patrick Traynor, Ph.D., professeur et directeur par intérim du Département d'informatique, des sciences et de l'ingénierie de l'information de l'UF, a dirigé une équipe qui a testé les cinq détecteurs de texte IA les plus populaires disponibles dans le commerce.
En utilisant environ 6 000 articles de recherche soumis à des conférences de sécurité de haut niveau avant même l’arrivée de ChatGPT, ils ont demandé aux LLM de créer des clones de ces mêmes articles, puis d’exécuter les deux ensembles via les détecteurs d’IA.
Les résultats ont montré des taux de faux positifs allant de 0,05 % à 68,6 % et, plus surprenant encore, des taux de faux négatifs compris entre 0,3 % et 99,6 %. Ce chiffre supérieur est proche de 100 %, ce qui signifie que le détecteur le moins performant a manqué pratiquement tout le texte généré par l’IA.
Alors que deux des cinq détecteurs fonctionnaient bien au départ, ils sont devenus largement inutiles après que les chercheurs ont demandé au LLM de réécrire ses résultats en utilisant un vocabulaire plus complexe (l'article appelle cela une attaque de complexité lexicale).


Pourquoi est-ce important au-delà de l’intégrité académique ?
Traynor l'a dit clairement : « Nous ne pouvons vraiment pas les utiliser pour statuer sur ces décisions. Les carrières des gens sont ici en jeu. » Une accusation d'écriture générée par l'IA dans une soumission peut nuire de façon permanente à la réputation d'un chercheur, mais nous ne pouvons pas accorder une confiance aveugle aux outils qui portent ces accusations.
L’argument est que les preuves d’une utilisation généralisée de l’IA dans les écrits universitaires ne sont pas elles-mêmes fiables. « Pour autant d'études que nous voyons affirmant qu'un certain pourcentage du travail universitaire est généré par l'IA, nous ne disposons en réalité d'aucun outil pour mesurer tout cela », a ajouté Traynor.
Ses recherches ne se limitent pas à critiquer les outils ; cela révèle un échec systémique en matière de diligence raisonnable de la part de chaque institution qui a adopté ces outils sans exiger la preuve de leur exactitude.








