Fraude scientifique : analyse d’un phénomène en hausse
- Un article frauduleux correspond à une publication scientifique délibérément erronée dont un ou plusieurs manquements à l’intégrité scientifique sont présents.
- Actuellement, les outils d’analyse sont loin de couvrir tous les cas de fraude, car celles-ci sont de nature très diverse, et chacune nécessite des détecteurs spécifiques.
- Les outils utilisés pour dissimuler des falsifications laissent des signatures spécifiques, comme des groupes de mots avec des fréquences spécifiques.
- Ces abus de confiance ne sont pas systématiquement réalisés par des individus isolés, mais peuvent être liés à des coopérations dans des réseaux d’éditeurs et d’auteurs.
- L’une des solutions pour faire face aux fraudes scientifiques serait de renforcer le système d’évaluation, par des actions plus préventives, voire de repenser ses indicateurs actuels.
Hausse des rétractations d’articles, prolifération des paper mills et des revues prédatrices : la littérature scientifique traverse une crise qui menace la confiance dans son intégrité. Cyril Labbé, chercheur en informatique à l’Université Grenoble Alpes, décrypte les causes qui ont conduit à de telles dérives. Il est l’un des spécialistes français de la détection automatique des fraudes et coordonne depuis 2020 le projet pluridisciplinaire NanoBubbles1, qui analyse pourquoi, quand et comment la science peine à se corriger elle-même.
Comment avez-vous commencé à travailler sur la fraude scientifique ?
Mon intérêt pour le sujet a émergé à partir de 2009, alors que les indicateurs bibliométriques, comme le h‑index, commençaient à être utilisés dans l’évaluation des chercheurs. Pour tester les limites des outils de calcul, j’ai créé un faux chercheur, « Ike Antkare » et lui ai attribué des dizaines de publications aberrantes générées automatiquement. Ces faux papiers se citant mutuellement, Google Scholar a attribué temporairement à Ike Antkare un h‑index plus élevé que celui d’Einstein. Cette expérience m’a convaincu de l’intérêt des recherches sur la détection automatique des articles frauduleux.
Que recouvre la notion d’article frauduleux ?
On désigne généralement par article frauduleux une publication scientifique délibérément erronée, que ce soit en partie ou intégralement. Les manquements à l’intégrité scientifique peuvent être de natures très diverses : plagiat, falsification ou fabrication de données, d’images et de résultats, citations abusives, achat d’articles produits par des paper mills… Dans les cas extrêmes, l’article, bien qu’en apparence scientifique, est entièrement dénué de sens.
Peut-on mesurer précisément l’ampleur du phénomène ?
Par définition, nous ne pouvons comptabiliser que les fraudes détectées – et les détecteurs disponibles sont loin de couvrir tous les cas. Il faut donc se contenter d’approximations. Je collabore par exemple avec Guillaume Cabanac de l’Institut de Recherche en Informatique de Toulouse (IRIT) sur un outil baptisé Problematic Paper Screener2 (PPS), qui repose sur neuf détecteurs différents. Sur l’ensemble de la littérature scientifique – environ 130 millions d’articles -, nous avons identifié :
- plus de 912000 articles contenant des références à des publications rétractées, et qui mériteraient donc d’être elles aussi revues ;
- environ 800 comportant certaines erreurs factuelles spécifiques ;
- plus 21000 qui contiennent des « expressions torturées » dénuées de sens qui peuvent provenir de plagiat ;
- plus de 350 totalement aberrants, générés automatiquement, parfois en ligne depuis des années.
Ces deux derniers chiffres sont d’autant plus alarmants qu’ils ne concernent pas seulement des revues prédatrices – qui publient sans véritable évaluation scientifique contre paiement -, mais aussi des éditeurs de renom comme Springer Nature, Elsevier ou Wiley. Cela révèle des défaillances profondes du système de revue par les pairs, qui est le cœur de l’évaluation scientifique.
Comment détectez-vous ces fraudes ?
Chaque type de fraude appelle un détecteur spécifique. Les outils utilisés pour produire ou dissimuler les fraudes laissent parfois des signatures caractéristiques. Certains générateurs de textes pseudo-scientifiques utilisent par exemple des groupes de mots avec une fréquence caractéristique. Certains logiciels de paraphrase, employés pour masquer les plagiats, introduisent dans le texte des “phrases torturées” : “bosom peril” remplace “breast cancer”, “made-man consciousness” est utilisé pour “artificial intelligence”, etc. Nos détecteurs exploitent ces failles. D’autres équipes traquent aussi les métadonnées, révélant par exemple des schémas de soumission automatisés.
Dans tous les cas, mettre au point un détecteur est un travail lent et minutieux. Rien d’étonnant à cela : il s’agit de réintroduire de l’expertise humaine là où elle a fait défaut. Et cela prend du temps.
Vous avez contacté les maisons d’édition “sérieuses” concernées par les fraudes détectées par Problematic Paper Screener. Comment expliquent-elles de tels manquements ?
Elles s’estiment victimes d’auteurs malhonnêtes ou d’éditeurs et relecteurs peu scrupuleux, souhaitant faire avancer leur carrière. En effet, la revue par les pairs est généralement déléguée à des chercheurs-évaluateurs bénévoles encadrés par un chercheur-éditeur, bénévole ou rémunéré, qui sélectionne les évaluateurs et prend la décision finale de rejeter ou d’accepter le manuscrit. L’investissement dans ces tâches collectives peut effectivement être pris en compte pour des promotions. Mais cette analyse me semble trop rapide.
En quoi est-elle trop rapide ?
D’abord parce que, contrairement à l’idée que l’on s’en fait généralement, les fraudes ne sont pas systématiquement le fait d’individus isolés. Une étude3 parue en août 2025 dans Proceedings of the National Academy of Sciences (PNAS), une revue scientifique États-Unienne, a mis en lumière de nombreux cas résultant d’une coopération entre des réseaux d’éditeurs et d’auteurs, ainsi que le rôle joué par des courtiers qui facilitent la soumission massive de publications frauduleuses dans des revues ciblées.

Ensuite, parce que les maisons d’édition ont elles aussi intérêt à augmenter leur volume de publication. Lorsqu’elles sont financées par abonnement, un grand volume permet d’augmenter les montants de commande en vendant des bouquets de revues, et en modèle “auteur-payeur”, plus d’articles signifie plus de revenus. Cet intérêt financier peut les conduire à fermer les yeux sur des pratiques douteuses – voire les provoquer.
Comment expliquer que des publications frauduleuses, voire aberrantes, restent en ligne pendant des années, sans que personne ne s’en émeuve ?
Il y a sans doute une tendance de la communauté scientifique à ne pas signaler les articles suspects ou absurdes, par prudence ou manque d’intérêt. Mais même lorsque les articles sont signalés, la rétractation peut être longue et difficile. Personne, des maisons d’éditions aux auteurs en passant par les éditeurs n’a envie de voir sa réputation entachée par une rétractation… Cela engendre des réticences, des résistances, au sein des maisons d’édition comme auprès des auteurs, même quand le problème est absolument manifeste.
Quelles actions sont menées pour améliorer la situation ?
Les actions sont généralement préventives plus que correctives. Des initiatives académiques ou privées (parfois au sein même des maisons d’édition) existent pour développer des détecteurs de fraude s’adaptant aux innovations des fraudeurs. Les maisons d’édition renforcent leurs comités d’éthique et la supervision de la revue par les pairs, et elles collaborent entre elles pour repérer certaines pratiques, comme la double soumission, qui le plus souvent n’est pas acceptée.
Les universités et le monde académique se mobilisent également. Dans la plupart des masters recherche, la formation à l’intégrité scientifique est par exemple devenue obligatoire.
En 2023, une lettre ouverte4 signée par une quinzaine de chercheurs internationaux avait été adressée à la direction du CNRS, en raison de sa gestion jugée trop peu sévère d’une affaire d’inconduite. Comment percevez-vous la volonté affichée par certains de durcir la répression contre les fraudeurs ?
C’est une ligne d’action que je ne privilégie pas. À mon sens, c’est le système d’évaluation actuel qui est à l’origine des dérives, et c’est lui qu’il faudrait réformer pour obtenir des résultats durables. Une évaluation purement quantitative est par nature dangereuse, puisqu’elle est aveugle au contenu scientifique des articles.
Comment faire évoluer le système d’évaluation ?
Il semble aujourd’hui impossible de bannir les métriques, mais il faut leur accorder moins d’importance dans l’évaluation individuelle et collective de la recherche. D’autres types de contributions pourraient être valorisées : en informatique, par exemple, la production de code ou de bases de données.
Mais à vrai dire, je doute que le système change à court terme : les indicateurs actuels sont trop faciles à établir et à utiliser, y compris pour les chercheurs. Nous touchons là un nouveau paradoxe : beaucoup d’entre eux dénoncent la pression subie et la survalorisation de l’article scientifique dans le système d’évaluation des chercheurs, mais il est facile et tentant d’avoir recours à ces indicateurs quantitatifs pour justifier de la pertinence d’un travail. Il est tellement plus simple d’annoncer à un financeur que l’on a publié dans une revue prestigieuse que d’expliquer les bénéfices de ses recherches pour la société…
Faut-il donc se résigner à une augmentation du nombre de fraudes ?
Surtout pas. Mais il faut agir avec patience et lucidité. Je suis convaincu que les sciences humaines ont un rôle central à jouer dans cette quête pour une littérature scientifique plus intègre. C’est pourquoi le projet ERC-Synergy NanoBubbles réunit des chercheurs de disciplines variées : Raphaël Lévy (université Paris Sorbonne Nord) expert en nanobiologie, Cyrus Mody (université de Maastricht) expert en histoire des sciences, Willem Halffman (université de Radboud), reconnu pour ses travaux sur le fonctionnement de l’expertise et de la politique scientifiques. Ensemble, avec les membres du projet, informaticiens, sociologues des sciences et philosophes, nous analysons l’évolution du monde académique et des maisons d’édition pour mieux comprendre la situation actuelle. Ce travail d’analyse est indispensable pour cerner les vulnérabilités, proposer des actions de prévention et de correction ciblées et ainsi contribuer à restaurer durablement la confiance dans la communauté scientifique.

