Accueil / Chroniques / Recherche : comment chasser les erreurs dans les publications médicales
Généré par l'IA / Generated using AI
π Société

Recherche : comment chasser les erreurs dans les publications médicales

Avatar
Alice Dreger
docteure en philosophie et ancienne professeure à l'Université Northwestern
En bref
  • Avec plusieurs millions d’articles scientifiques publiés chaque année, la dépollution de la littérature scientifique a tout de la recherche d’une aiguille dans une botte de foin.
  • L’évaluation visant uniquement les publications à impact est une approche retenue par The Medical Evidence Project, une initiative américaine financée par une subvention de démarrage de 900 000 dollars.
  • Les analystes utilisent principalement des méthodes statistiques pour identifier les incohérences dans les données et les conclusions présentées dans les articles.
  • GRIM-U est un outil capable de détecter un type particulier d’incohérences mathématiques dans certains tests statistiques.

Lan­cé en juin 2025 avec un finan­ce­ment de l’organisme de finan­ce­ment phi­lan­thro­pique, Coef­fi­cient Giving, The Medi­cal Evi­dence Pro­ject ambi­tionne de détec­ter les articles peu fiables, qu’ils soient frau­du­leux ou non, sus­cep­tibles d’influencer les recom­man­da­tions médi­cales en vigueur. Nous en dis­cu­tons avec Alice Dre­ger, doc­teur en phi­lo­so­phie et édi­trice du projet.

Dépollution de la littérature scientifique : une approche ciblée

Avec plu­sieurs mil­lions d’articles scien­ti­fiques publiés chaque année dans des revues à comi­té de lec­ture, la dépol­lu­tion de la lit­té­ra­ture scien­ti­fique a tout de la recherche d’une aiguille dans une botte de foin. Par où com­men­cer pour tra­quer les ano­ma­lies ? Si cer­tains misent sur une ana­lyse sys­té­ma­tique de toute la lit­té­ra­ture pour repé­rer les traces lais­sées par cer­taines pra­tiques frau­du­leuses auto­ma­ti­sées, d’autres entendent se concen­trer sur une éva­lua­tion beau­coup plus ciblée, visant uni­que­ment les publi­ca­tions à impact. Cette seconde approche est celle rete­nue par The Medi­cal Evi­dence Pro­ject, une ini­tia­tive explo­ra­toire amé­ri­caine finan­cée par une sub­ven­tion de démar­rage de 900 000 dol­lars accor­dée par Coef­fi­cient Giving. Ancien­ne­ment Open Phi­lan­thro­py, cet orga­nisme se reven­dique de l’altruisme “effi­cace” — com­pre­nez : qu’il sou­tient les ini­tia­tives en fonc­tion de leur impact mesu­rable attendu.

Le pro­jet réunit des membres per­ma­nents et des consul­tants autour de James Hea­thers, PhD, cher­cheur asso­cié de l’université de Lin­naeus en Suède mais tra­vaillant depuis plu­sieurs années hors d’un cadre aca­dé­mique clas­sique. Il est héber­gé par le Centre pour l’Intégrité scien­ti­fique. Cette orga­ni­sa­tion amé­ri­caine à but non lucra­tif, lan­cée en 2014, est connue pour être l’organisation mère de Retrac­tion Watch, un site d’information recen­sant et docu­men­tant les rétrac­ta­tions d’articles scientifiques.

The Medi­cal Evi­dence Pro­ject a donc fait de l’efficacité son che­val de bataille, en choi­sis­sant de se concen­trer sur les articles qui sou­tiennent des recom­man­da­tions médi­cales en vigueur ayant une influence directe et signi­fi­ca­tive sur la mor­bi­di­té et la mor­ta­li­té des patients, par exemple celles qui sont inté­grées dans des gui­de­lines cli­niques offi­cielles ou qui influencent la pra­tique médi­cale stan­dard. Un objec­tif que James Hea­thers résume sur sa page Lin­ke­din par un slo­gan accro­cheur : « Fin­ding bad medi­cal evi­dence before it kills people. » (repé­rer les preuves médi­cales défaillantes avant qu’elles ne tuent des gens).

L’équipe mise pour son entre­prise sur « la métas­cience foren­sique ». « Elle est exac­te­ment ce que son nom indique : un tra­vail d’en­quête (foren­sique) uti­li­sant des outils scien­ti­fiques (science) pour exa­mi­ner la lit­té­ra­ture scien­ti­fique (une démarche méta). », explique Alice Dreger.

Concrè­te­ment, les ana­lystes uti­lisent prin­ci­pa­le­ment des méthodes sta­tis­tiques pour iden­ti­fier les inco­hé­rences dans les don­nées et les conclu­sions pré­sen­tées dans les articles. Comme le sou­ligne James Hea­thers, qui a for­ma­li­sé le concept dans un article inti­tu­lé Intro­duc­tion à la métas­cience foren­sique1, « l’analyse métas­cien­ti­fique foren­sique est conçue pour modi­fier le niveau de confiance en éva­luant la cohé­rence de la recherche. Elle n’est pas conçue pour “détec­ter la fraude”. Même si cela peut arri­ver, ce n’est pas l’objectif prin­ci­pal de la métas­cience foren­sique en tant que domaine de recherche et pra­tique — ce n’en est que la consé­quence la plus visible ».

GRIM‑U : un premier outil de détection des incohérences mathématiques

Un an seule­ment après son lan­ce­ment, il faut avouer que les fruits visibles du pro­jet sont encore limi­tés. Alice Dre­ger n’y voit tou­te­fois rien d’étonnant : « La pre­mière année de notre pro­jet a été conçue dès le départ pour se concen­trer sur le déve­lop­pe­ment d’un sys­tème per­met­tant de déter­mi­ner où nos ana­lystes devraient concen­trer leurs efforts en matière d’analyse appro­fon­die. » L’équipe a de fait annon­cé la mise au point d’un pre­mier outil, GRIM‑U2, capable de détec­ter un type par­ti­cu­lier d’incohérences mathé­ma­tiques dans cer­tains tests sta­tis­tiques, les tests dits « U de Mann-Whit­ney », qui peuvent être uti­li­sés en recherche cli­nique pour com­pa­rer deux groupes indé­pen­dants de patients. « GRIM‑U a récem­ment ser­vi à éclai­rer le rap­port de Retrac­tion Watch concer­nant le tra­vail d’un chi­rur­gien. » L’outil aurait en effet détec­té des ano­ma­lies sta­tis­tiques dans un court article sou­te­nant l’efficacité d’un dis­po­si­tif chi­rur­gi­cal déve­lop­pé par le pra­ti­cien et ses col­lègues3.

Mais la cher­cheuse ne s’en cache pas, déve­lop­per des outils effi­caces est une entre­prise com­plexe, et doit affron­ter des défis majeurs, notam­ment « les res­tric­tions légales sur l’ex­trac­tion de don­nées, des­ti­nées à pro­té­ger les droits de pro­prié­té intel­lec­tuelle, et la dif­fi­cul­té à opti­mi­ser les codes de détec­tion pour évi­ter les faux posi­tifs ». L’équipe peut par ailleurs comp­ter sur une com­mu­nau­té très col­la­bo­ra­tive, et n’hésitera pas à uti­li­ser les outils éma­nant d’autres contri­bu­teurs si besoin. Reste à voir, dans les douze pro­chains mois, si cette stra­té­gie ciblée pro­dui­ra des résul­tats à la hau­teur de ses ambitions.

Anne Orliac
1Hea­thers J An Intro­duc­tion to Foren­sic Metas­cience (2025).pdf
2Hea­thers, James, and David Robert Grimes. 2026. “GRIM‑U : A GRIM-like obser­va­tion to esta­blish impos­sible p values from ran­ked tests.” Avai­lable at medi​ca​le​vi​den​ce​pro​ject​.org/​GRIMU.
3https://​retrac​tion​watch​.com/​2​0​2​6​/​0​1​/​0​7​/​u​k​-​s​u​r​g​e​o​n​-​a​n​k​u​r​-​k​h​a​j​u​r​i​a​-​i​n​v​e​n​t​o​r​-​u​n​r​e​p​r​o​d​u​c​i​b​l​e​-​d​a​t​a​-​g​u​a​r​a​n​t​e​e​d​-​p​u​b​l​i​c​a​t​ions/

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don à Polytechnique Insights