Male doctor showing realistic graph data of health care and health insurance business and growth with medical and medical financial analysis.Generative AI
π Santé et biotech π Numérique
Les innovations numériques au service de la santé

Comment prédire les prochaines épidémies ?

Etienne Minvielle, directeur de recherche CNRS et professeur en management de la santé au sein du Centre de recherche en gestion de l’Institut interdisciplinaire de l'innovation (I³-CRG*) et Antoine Flahault, médecin et docteur en biomathématiques
Le 10 janvier 2024 |
4 min. de lecture
Etienne Minvielle
Etienne Minvielle
directeur de recherche CNRS et professeur en management de la santé au sein du Centre de recherche en gestion de l’Institut interdisciplinaire de l'innovation (I³-CRG*)
Antoine Flahault
Antoine Flahault
médecin et docteur en biomathématiques
En bref
  • Depuis le 20ème siècle, différents types de modèles prédictifs des risques épidémiques se sont succédé et ont prouvé leur efficacité.
  • Les Big Data ont fait évoluer ces modèles : ils anticipent plus efficacement les épidémies pour concentrer l’aide humanitaire dans la zone à risque, au moment clé.
  • Or, quelques défis persistent : adapter les prédictions aux contextes locaux, le passage de la prédiction à l’action qui est entravé par des facteurs socio-économiques.
  • En cumulant le traitement des Big Data, expertises épidémiologiques et un traitement algorithmique, on multiplierait le potentiel de ces modèles.

Les mod­èles pré­dic­tifs des risques épidémiques aident à analyser les évo­lu­tions tem­porelles et géo­graphiques des épidémies. Ils n’ont pas atten­du les algo­rithmes pour exis­ter. En revanche, depuis l’apparition des « Big Data », ces mod­èles ont bien évolué et posent cer­taines ques­tions. Quelle est la fia­bil­ité de la pré­dic­tion ? Com­ment éval­uer notre capac­ité à col­lecter des don­nées ? Quel est le rôle de ces mod­èles pour engager l’action ?  

Modèles prédictifs : l’avant et l’après Big Data

Depuis le 20ème siè­cle, de nom­breux mod­èles ont vu le jour et ont fait leurs preuves. Le mod­èle math­é­ma­tique SIR, créé en 1927, con­stitue la base de la plu­part des mod­èles épidémi­ologiques. Il est fondé sur des flux entre les com­par­ti­ments des sus­cep­ti­bles (S), des infectés/contagieux (I) et des retirés de la chaîne de trans­mis­sion (R) – c’est-à-dire les per­son­nes immu­nisées ou décédées1.

L’infection est qual­i­fiée d’épidémie lorsque le nom­bre de malades aug­mente au cours du temps, c’est-à-dire que le nom­bre de nou­veaux infec­tés R0 est posi­tif – comme nous avons eu l’habitude de voir pen­dant la crise du covid-19. En clair, cela sig­ni­fie que chaque cas génère à lui seul au moins un cas.

En par­al­lèle, d’autres mod­èles – ARIMA2 et SARIMA3, par exem­ple – ne se basent pas sur le mod­èle SIR, mais sur des « séries chronologiques ». Ils par­tent de l’hypothèse que ce qui s’est passé dans les séries précé­dentes va se pass­er dans les séries à venir. Ces mod­èles sont effi­caces sur des événe­ments saison­niers comme la grippe.

Avec l’émergence des Big Data, de nou­veaux mod­èles pré­dic­tifs sont apparus. Ceux-ci per­me­t­tent d’anticiper les épidémies pour con­cen­tr­er l’aide human­i­taire dans la zone à risque, au moment clé4. Ces dernières années, des appli­ca­tions con­crètes ont fait leurs preuves. Par exem­ple, pour lut­ter con­tre Ebo­la en Afrique, Médecins sans fron­tières a con­stru­it des cen­tres de san­té dans des zones de flux impor­tants, repérées grâce aux don­nées des opéra­teurs télé­phoniques5. La cap­ture de don­nées d’un nou­veau genre et en grand nom­bre ouvre de nou­velles per­spec­tives de traite­ment. En cela, la préven­tion algo­rith­mique est effective. 

Imprévisibilité, et rapport à l’action : les défis de ces modèles du Big Data

Il sem­ble qu’actuellement, les mod­èles prévoient davan­tage à échéance brève ou immé­di­ate que sur un futur à plus long terme. Aucune des récentes mal­adies (COVID-19, Zika, West Nile, Chikun­gun­ya) n’a jamais été prédite, nous arrivons tou­jours après. Lorsque l’on cherche à prédire un risque de sur­v­enue d’une épidémie, les mod­èles ont ten­dance à sures­timer le risque.

En jan­vi­er 2013, l’interface Google Flu Trends a par exem­ple annon­cé – à tort – une grave épidémie de grippe à New-York. Fondées sur cette pré­dic­tion, des actions de préven­tion de grande ampleur ont été engagées, puis se sont révélées par­faite­ment inutiles. De même, le CDC d’Atlanta (le cen­tre pour le con­trôle et la préven­tion des épidémies améri­cain) a prédit des chiffres de plus d’un mil­lion de cas de virus Ebo­la au Liberia, alors qu’il n’y a eu, fort heureuse­ment, que quelques dizaines de mil­liers de cas finalement.

En revanche, les mod­èles sont effi­caces pour suiv­re l’évolution des épidémies à court-terme. Google Flu Trends l’a démon­tré à de maintes occa­sions. Autre exem­ple : lors de la pandémie du COVID-19, Google Ver­i­ly, l’Université de Genève ou encore l’École poly­tech­nique de Lau­sanne-Zurich ont pu prédire à court-terme les vagues épidémiques.

L’autre prob­lème ren­con­tré par les mod­èles est le rap­port entre résul­tats et action. D’une part, un mod­èle pro­duit à l’échelle nationale n’a pas for­cé­ment la puis­sance suff­isante pour éval­uer une sit­u­a­tion locale. Pen­dant la pandémie de COVID-19, des mod­èles locaux ont, par exem­ple, été élaborés en plus du mod­èle nation­al Pas­teur, au niveau de la Mar­tinique. Ce mod­èle très sim­ple antic­i­pait sur 14 jours le nom­bre de lits COVID néces­saires en l’absence de con­fine­ment. Lors de la 4ème vague (la plus impor­tante), le mod­èle a prédit 700 lits COVID néces­saires, se révélant assez fiable puisque 600 lits ont finale­ment été util­isés. Ce mod­èle a per­mis d’anticiper effi­cace­ment l’impact sur les ser­vices d’hôpital de jour de patholo­gies chroniques et d’ouvrir des lits en con­séquence, témoignant de la néces­sité de com­pléter les analy­ses glob­ales par d’autres, situées et adap­tées au con­texte local. 

D’autre part, indépen­dam­ment du mod­èle retenu, de sa fia­bil­ité et de son adap­ta­tion à un con­texte local, la pré­dic­tion ne peut pas à elle seule gou­vern­er l’action. La pandémie de COVID-19 a mon­tré que les rétifs à la vac­ci­na­tion étaient nom­breux, avec des pro­fils et des moti­va­tions var­iés. En Chine, les per­son­nes âgées ont été découragées par les médecins qui évo­quaient leur san­té frag­ile. Dans le cas des pop­u­la­tions Afro-Améri­caine et Antil­laise, c’est plutôt une défi­ance envers les pou­voirs occi­den­taux qui est apparue comme motif d’une résis­tance à la vac­ci­na­tion. Les raisons de la réti­cence à la vac­ci­na­tion ont donc été nom­breuses, et indépen­dantes de la ques­tion de la prédiction.

D’une manière générale, ces défis révè­lent que le pas­sage de la pré­dic­tion à l’action de préven­tion n’est pas linéaire et séquen­tiel. D’autres fac­teurs socio-économiques inter­vi­en­nent, soulig­nant l’importance d’inscrire les mod­èles pré­dic­tifs dans le con­texte de leur usage.

Le futur de la prédiction : vers une intégration multidimensionnelle et unifiée ?

L’apport des Big Data sem­ble pou­voir amélior­er les choses. Des mod­èles pré­dic­tifs, dits mul­ti-niveaux, appa­rais­sent envis­age­ables en com­bi­nant davan­tage d’expertises épidémi­ologiques, des Big Data et un traite­ment algo­rith­mique. Une telle mod­éli­sa­tion, où chaque strate pour­rait con­tribuer à la pré­ci­sion, con­cerne une var­iété de don­nées : imagerie satel­li­taire, don­nées biologiques, éco­nom­i­co-sociales, veille san­i­taire, etc.

Cela sup­pose de dynamiser les recueils de don­nées et leur partage. A cet égard, la remon­tée des don­nées en France lors de la dernière crise Covid a mon­tré que la démarche n’est pas encore spon­tanée. Il aurait été – et il est tou­jours – souhaitable de met­tre en place un entre­pôt de don­nées unifié, afin que les experts puis­sent y puis­er les don­nées dont ils ont besoin. Pour ce faire, il faut appren­dre à s’organiser dans le partage des don­nées exis­tantes. Un défi de taille pour pro­gress­er dans la préven­tion algo­rith­mique des risques épidémiques.

Propos recueillis par Loraine Odot
1Weiss HH (2013) The SIR mod­el and the foun­da­tions of pub­lic health. Mater Mat 2013(3):1–17
2Singh RK, Rani M, Bha­ga­vathu­la AS, Sah R, Rodriguez-Morales AJ, Kali­ta H, et al. Pre­dic­tion of the COVID-19 Pan­dem­ic for the Top 15 Affect­ed Coun­tries: Advanced Autore­gres­sive Inte­grat­ed Mov­ing Aver­age (ARIMA) Mod­el. JMIR Pub­lic Health Sur­veill 2020 May 13;6(2):e19115
3Per­one, G. Using the SARIMA mod­el to fore­cast the fourth glob­al wave of cumu­la­tive deaths from COVID-19: Evi­dence from 12 hard-hit big coun­tries. Econo­met­rics 10(2), 18 (2022)
4Col­ston JM ‚Ahmed T, Mahopo C et al Eval­u­at­ing mete­o­ro­log­i­cal data from weath­er sta­tions, and from satel­lites and glob­al mod­els for a mul­ti-site epi­demi­o­log­i­cal study. Env­i­ron Res. 2018; 165: 91–109
5Brinkel J, Kramer A, Krumkamp R et al. Mobile phone-based mHealth approach­es for pub­lic health sur­veil­lance in sub-Saha­ran Africa: a sys­tem­at­ic review. Int J Env­i­ron Res Pub­lic Healthc2014 ; 11 : 11559–11582.

Le monde expliqué par la science. Une fois par semaine, dans votre boîte mail.

Recevoir la newsletter