Male doctor showing realistic graph data of health care and health insurance business and growth with medical and medical financial analysis.Generative AI
π Santé et biotech π Numérique
Les innovations numériques au service de la santé

Comment prédire les prochaines épidémies ?

avec Etienne Minvielle, directeur du Centre de recherche en gestion de l'École polytechnique (IP Paris) et Antoine Flahault, médecin et docteur en biomathématiques
Le 10 janvier 2024 |
4 min. de lecture
Etienne Minvielle
Etienne Minvielle
directeur du Centre de recherche en gestion de l'École polytechnique (IP Paris)
Antoine Flahault
Antoine Flahault
médecin et docteur en biomathématiques
En bref
  • Depuis le 20ème siècle, différents types de modèles prédictifs des risques épidémiques se sont succédé et ont prouvé leur efficacité.
  • Les Big Data ont fait évoluer ces modèles : ils anticipent plus efficacement les épidémies pour concentrer l’aide humanitaire dans la zone à risque, au moment clé.
  • Or, quelques défis persistent : adapter les prédictions aux contextes locaux, le passage de la prédiction à l’action qui est entravé par des facteurs socio-économiques.
  • En cumulant le traitement des Big Data, expertises épidémiologiques et un traitement algorithmique, on multiplierait le potentiel de ces modèles.

Les modèles pré­dic­tifs des risques épi­dé­miques aident à ana­ly­ser les évo­lu­tions tem­po­relles et géo­gra­phiques des épi­dé­mies. Ils n’ont pas atten­du les algo­rithmes pour exis­ter. En revanche, depuis l’apparition des « Big Data », ces modèles ont bien évo­lué et posent cer­taines ques­tions. Quelle est la fia­bi­li­té de la pré­dic­tion ? Com­ment éva­luer notre capa­ci­té à col­lec­ter des don­nées ? Quel est le rôle de ces modèles pour enga­ger l’action ?  

Modèles prédictifs : l’avant et l’après Big Data

Depuis le 20ème siècle, de nom­breux modèles ont vu le jour et ont fait leurs preuves. Le modèle mathé­ma­tique SIR, créé en 1927, consti­tue la base de la plu­part des modèles épi­dé­mio­lo­giques. Il est fon­dé sur des flux entre les com­par­ti­ments des sus­cep­tibles (S), des infectés/contagieux (I) et des reti­rés de la chaîne de trans­mis­sion (R) – c’est-à-dire les per­sonnes immu­ni­sées ou décé­dées1.

L’infection est qua­li­fiée d’épidémie lorsque le nombre de malades aug­mente au cours du temps, c’est-à-dire que le nombre de nou­veaux infec­tés R0 est posi­tif – comme nous avons eu l’habitude de voir pen­dant la crise du covid-19. En clair, cela signi­fie que chaque cas génère à lui seul au moins un cas.

En paral­lèle, d’autres modèles – ARIMA2 et SARIMA3, par exemple – ne se basent pas sur le modèle SIR, mais sur des « séries chro­no­lo­giques ». Ils partent de l’hypothèse que ce qui s’est pas­sé dans les séries pré­cé­dentes va se pas­ser dans les séries à venir. Ces modèles sont effi­caces sur des évé­ne­ments sai­son­niers comme la grippe.

Avec l’émergence des Big Data, de nou­veaux modèles pré­dic­tifs sont appa­rus. Ceux-ci per­mettent d’anticiper les épi­dé­mies pour concen­trer l’aide huma­ni­taire dans la zone à risque, au moment clé4. Ces der­nières années, des appli­ca­tions concrètes ont fait leurs preuves. Par exemple, pour lut­ter contre Ebo­la en Afrique, Méde­cins sans fron­tières a construit des centres de san­té dans des zones de flux impor­tants, repé­rées grâce aux don­nées des opé­ra­teurs télé­pho­niques5. La cap­ture de don­nées d’un nou­veau genre et en grand nombre ouvre de nou­velles pers­pec­tives de trai­te­ment. En cela, la pré­ven­tion algo­rith­mique est effective. 

Imprévisibilité, et rapport à l’action : les défis de ces modèles du Big Data

Il semble qu’actuellement, les modèles pré­voient davan­tage à échéance brève ou immé­diate que sur un futur à plus long terme. Aucune des récentes mala­dies (COVID-19, Zika, West Nile, Chi­kun­gu­nya) n’a jamais été pré­dite, nous arri­vons tou­jours après. Lorsque l’on cherche à pré­dire un risque de sur­ve­nue d’une épi­dé­mie, les modèles ont ten­dance à sur­es­ti­mer le risque.

En jan­vier 2013, l’interface Google Flu Trends a par exemple annon­cé – à tort – une grave épi­dé­mie de grippe à New-York. Fon­dées sur cette pré­dic­tion, des actions de pré­ven­tion de grande ampleur ont été enga­gées, puis se sont révé­lées par­fai­te­ment inutiles. De même, le CDC d’Atlanta (le centre pour le contrôle et la pré­ven­tion des épi­dé­mies amé­ri­cain) a pré­dit des chiffres de plus d’un mil­lion de cas de virus Ebo­la au Libe­ria, alors qu’il n’y a eu, fort heu­reu­se­ment, que quelques dizaines de mil­liers de cas finalement.

En revanche, les modèles sont effi­caces pour suivre l’évolution des épi­dé­mies à court-terme. Google Flu Trends l’a démon­tré à de maintes occa­sions. Autre exemple : lors de la pan­dé­mie du COVID-19, Google Veri­ly, l’Université de Genève ou encore l’École poly­tech­nique de Lau­sanne-Zurich ont pu pré­dire à court-terme les vagues épidémiques.

L’autre pro­blème ren­con­tré par les modèles est le rap­port entre résul­tats et action. D’une part, un modèle pro­duit à l’échelle natio­nale n’a pas for­cé­ment la puis­sance suf­fi­sante pour éva­luer une situa­tion locale. Pen­dant la pan­dé­mie de COVID-19, des modèles locaux ont, par exemple, été éla­bo­rés en plus du modèle natio­nal Pas­teur, au niveau de la Mar­ti­nique. Ce modèle très simple anti­ci­pait sur 14 jours le nombre de lits COVID néces­saires en l’absence de confi­ne­ment. Lors de la 4ème vague (la plus impor­tante), le modèle a pré­dit 700 lits COVID néces­saires, se révé­lant assez fiable puisque 600 lits ont fina­le­ment été uti­li­sés. Ce modèle a per­mis d’anticiper effi­ca­ce­ment l’impact sur les ser­vices d’hôpital de jour de patho­lo­gies chro­niques et d’ouvrir des lits en consé­quence, témoi­gnant de la néces­si­té de com­plé­ter les ana­lyses glo­bales par d’autres, situées et adap­tées au contexte local. 

D’autre part, indé­pen­dam­ment du modèle rete­nu, de sa fia­bi­li­té et de son adap­ta­tion à un contexte local, la pré­dic­tion ne peut pas à elle seule gou­ver­ner l’action. La pan­dé­mie de COVID-19 a mon­tré que les rétifs à la vac­ci­na­tion étaient nom­breux, avec des pro­fils et des moti­va­tions variés. En Chine, les per­sonnes âgées ont été décou­ra­gées par les méde­cins qui évo­quaient leur san­té fra­gile. Dans le cas des popu­la­tions Afro-Amé­ri­caine et Antillaise, c’est plu­tôt une défiance envers les pou­voirs occi­den­taux qui est appa­rue comme motif d’une résis­tance à la vac­ci­na­tion. Les rai­sons de la réti­cence à la vac­ci­na­tion ont donc été nom­breuses, et indé­pen­dantes de la ques­tion de la prédiction.

D’une manière géné­rale, ces défis révèlent que le pas­sage de la pré­dic­tion à l’action de pré­ven­tion n’est pas linéaire et séquen­tiel. D’autres fac­teurs socio-éco­no­miques inter­viennent, sou­li­gnant l’importance d’inscrire les modèles pré­dic­tifs dans le contexte de leur usage.

Le futur de la prédiction : vers une intégration multidimensionnelle et unifiée ?

L’apport des Big Data semble pou­voir amé­lio­rer les choses. Des modèles pré­dic­tifs, dits mul­ti-niveaux, appa­raissent envi­sa­geables en com­bi­nant davan­tage d’expertises épi­dé­mio­lo­giques, des Big Data et un trai­te­ment algo­rith­mique. Une telle modé­li­sa­tion, où chaque strate pour­rait contri­buer à la pré­ci­sion, concerne une varié­té de don­nées : ima­ge­rie satel­li­taire, don­nées bio­lo­giques, éco­no­mi­co-sociales, veille sani­taire, etc.

Cela sup­pose de dyna­mi­ser les recueils de don­nées et leur par­tage. A cet égard, la remon­tée des don­nées en France lors de la der­nière crise Covid a mon­tré que la démarche n’est pas encore spon­ta­née. Il aurait été – et il est tou­jours – sou­hai­table de mettre en place un entre­pôt de don­nées uni­fié, afin que les experts puissent y pui­ser les don­nées dont ils ont besoin. Pour ce faire, il faut apprendre à s’organiser dans le par­tage des don­nées exis­tantes. Un défi de taille pour pro­gres­ser dans la pré­ven­tion algo­rith­mique des risques épidémiques.

Propos recueillis par Loraine Odot
1Weiss HH (2013) The SIR model and the foun­da­tions of public health. Mater Mat 2013(3):1–17
2Singh RK, Rani M, Bha­ga­va­thu­la AS, Sah R, Rodri­guez-Morales AJ, Kali­ta H, et al. Pre­dic­tion of the COVID-19 Pan­de­mic for the Top 15 Affec­ted Coun­tries : Advan­ced Auto­re­gres­sive Inte­gra­ted Moving Ave­rage (ARIMA) Model. JMIR Public Health Sur­veill 2020 May 13;6(2):e19115
3Per­one, G. Using the SARIMA model to fore­cast the fourth glo­bal wave of cumu­la­tive deaths from COVID-19 : Evi­dence from 12 hard-hit big coun­tries. Eco­no­me­trics 10(2), 18 (2022)
4Col­ston JM ‚Ahmed T, Maho­po C et al Eva­lua­ting meteo­ro­lo­gi­cal data from wea­ther sta­tions, and from satel­lites and glo­bal models for a mul­ti-site epi­de­mio­lo­gi­cal stu­dy. Envi­ron Res. 2018 ; 165 : 91–109
5Brin­kel J, Kra­mer A, Krum­kamp R et al. Mobile phone-based mHealth approaches for public health sur­veillance in sub-Saha­ran Afri­ca : a sys­te­ma­tic review. Int J Envi­ron Res Public Healthc2014 ; 11 : 11559–11582.

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don