Citations Hallucinées dans 50 Articles Scientifiques
Imaginez soumettre un article scientifique à une conférence prestigieuse, obtenir de bonnes évaluations, et découvrir ensuite que certaines références bibliographiques n’ont jamais existé. Elles ont simplement été inventées par un modèle d’intelligence artificielle. Cela semble improbable ? Pourtant, c’est exactement ce qu’a révélé une enquête menée par une jeune startup canadienne.
Quand l’IA invente des références scientifiques
La conférence ICLR, acronyme d’International Conference on Learning Representations, est l’une des plus influentes dans le domaine de l’apprentissage profond. Chaque année, des milliers de chercheurs y soumettent leurs travaux. Pour l’édition 2026, un détail inquiétant a été mis en lumière par GPTZero, une entreprise basée à Toronto spécialisée dans la détection de contenus générés par IA.
En analysant seulement 300 soumissions parmi les 20 000 reçues, l’équipe a identifié 50 articles contenant au moins une citation manifestement hallucinée. Des références à des auteurs fictifs, des articles attribués à des revues qui n’en ont jamais entendu parler, ou tout simplement des titres sans équivalent réel dans la littérature scientifique.
Le plus troublant ? Ces papiers avaient passé avec succès l’étape de la relecture par les pairs. Trois à cinq experts les avaient examinés, et la plupart n’avaient pas repéré les faux. Sans intervention, ces travaux auraient très probablement été acceptés et publiés.
GPTZero, le détective des hallucinations
Créée en 2022 par Alex Cui et Edward Tian, GPTZero s’est rapidement imposée comme un outil de référence pour identifier les textes produits par des grands modèles de langage. L’entreprise a développé un module spécifique, baptisé Hallucination Check, capable de scruter les références bibliographiques.
Alex Cui, cofondateur et directeur technique, ne cache pas sa surprise face aux résultats.
« Nous sommes assez surpris. On a frappé fort, mais dans le mauvais sens. Il y en a probablement beaucoup plus ailleurs. »
– Alex Cui, cofondateur de GPTZero
L’équipe collabore désormais avec les organisateurs d’ICLR pour étendre l’analyse à l’ensemble des soumissions. Objectif : identifier et retirer les articles problématiques avant les annonces d’acceptation prévues dans quelques semaines.
Colin Raffel, professeur associé à l’Université de Toronto et responsable de programme à ICLR, confirme que les organisateurs prennent la situation au sérieux et continuent de rejeter les soumissions non conformes.
Pourquoi tant de citations inventées passent inaperçues ?
Plusieurs facteurs expliquent ce phénomène. D’abord, la pression académique incite certains chercheurs à produire toujours plus rapidement. L’utilisation d’IA pour rédiger ou enrichir les bibliographies devient tentante.
Ensuite, le volume croissant de soumissions met le système de relecture par les pairs sous tension. Les experts, souvent bénévoles et déjà surchargés, manquent parfois de temps pour vérifier chaque référence en profondeur.
Blair Attard-Frost, professeure adjointe en science politique à l’Université de l’Alberta, étudie depuis près de dix ans les questions d’éthique et de gouvernance de l’IA.
« Vous avez cet afflux massif de papiers qui exerce une pression supplémentaire sur les processus de relecture, alors que les universitaires sont déjà épuisés et ont une capacité limitée. »
– Blair Attard-Frost, Université de l’Alberta
Elle souligne que la relecture reste un travail bénévole, rarement valorisé dans les carrières académiques.
L’IA dans la recherche : promesse et périls
Les modèles génératifs offrent des avantages indéniables. Certains études montrent qu’ils peuvent aider à identifier des failles méthodologiques ou accélérer la rédaction de revues de littérature. Mais les limites sont tout aussi évidentes.
Des travaux récents ont démontré que les IA tendent à attribuer des notes trop généreuses lors de relectures, augmentant artificiellement les taux d’acceptation. Dans le domaine médical, entre 50 % et 90 % des réponses fournies par des modèles ne sont pas pleinement soutenues par les sources citées.
Le problème dépasse le monde académique. Des rapports commandés par des gouvernements, comme celui de Deloitte pour Terre-Neuve-et-Labrador ou pour l’Australie, ont également contenu des références fictives probablement générées par IA.
Quelles solutions pour préserver l’intégrité scientifique ?
Plusieurs pistes émergent pour endiguer le phénomène.
- Outils de détection automatisés comme celui de GPTZero, même s’ils ne sont pas infaillibles (taux d’erreur possible autour de 1 %).
- Modèles de soumission avec frais progressifs pour décourager la production massive assistée par IA.
- Systèmes d’endossement humain obligatoire pour valider l’authenticité des contributions.
- Directives claires sur l’usage autorisé de l’IA dans les processus de rédaction et de relecture.
Alex Cui reste optimiste quant à la capacité technologique à répondre au défi.
« Il y a une bonne et une mauvaise façon d’utiliser l’IA. Rejeter totalement ces outils n’est pas utile. Utilisons-les, mais tenons leurs productions à un standard plus élevé. »
– Alex Cui
Blair Attard-Frost, plus prudente, insiste sur la nécessité d’aborder le problème structurel : surcharge des chercheurs, manque de ressources, valorisation insuffisante de la relecture.
Vers une responsabilité accrue
Cette affaire met en lumière une transition difficile. L’intelligence artificielle transforme profondément la recherche scientifique, accélérant certaines tâches tout en introduisant de nouveaux risques. La communauté académique doit rapidement définir des garde-fous clairs.
Les conférences comme ICLR montrent l’exemple en intégrant des outils de vérification. D’autres organisateurs, éditeurs de revues et institutions financeront probablement des solutions similaires dans les mois à venir.
En définitive, cette découverte de GPTZero n’est pas seulement un scandale : c’est un signal d’alarme. Elle rappelle que la rigueur scientifique reste une responsabilité humaine, même à l’ère où les machines rédigent, résument et citent à notre place.
La question n’est plus de savoir si l’IA va s’imposer dans la recherche, mais comment nous allons réussir à la domestiquer pour qu’elle serve le progrès sans compromettre la confiance dans la science.
Les prochaines années seront décisives. Les acteurs comme GPTZero, les conférences majeures et les universités ont déjà commencé à bouger. Reste à espérer que le mouvement s’amplifie avant que les hallucinations ne deviennent la norme plutôt que l’exception.