Accueil / Chroniques / Covid-19 : une mortalité plus élevée qu’il n’y paraît
nursing home
π Santé et biotech π Société

Covid-19 : une mortalité plus élevée qu’il n’y paraît

Nicolas Chopin
Nicolas Chopin
professeur de data science et machine learning ENSAE au Centre de recherche en économie et statistique*

Depuis le début de la pan­dé­mie, les don­nées d’infectivité ou de mor­ta­li­té liées à la Covid-19 mobi­lisent l’attention du monde entier. Pour­tant, aucun de ces deux para­mètres n’est tota­le­ment fiable. En mars, lors du pre­mier confi­ne­ment, Nico­las Cho­pin, pro­fes­seur en sta­tis­tique et science des don­nées à l’École natio­nale de la sta­tis­tique et de l’administration éco­no­mique (ENSAE) s’est lan­cé dans une ana­lyse plus appro­fon­die des chiffres four­nis par les auto­ri­tés fran­çaises. À l’instar d’autres cher­cheurs, il a décou­vert que les taux de mor­ta­li­té de la Covid-19 étaient pro­ba­ble­ment sous-estimés.

Pen­dant le confi­ne­ment, vous avez exa­mi­né les don­nées rela­tives à la pan­dé­mie sous un angle dif­fé­rent. Qu’avez-vous constaté ?

Au début de la crise, tout le monde ne par­lait que de la Covid-19 et je tenais à me rendre utile, d’une manière ou d’une autre. En tant que pro­fes­seur en sta­tis­tique et science des don­nées, je me suis mis en quête de don­nées publiques. Au départ, mon inten­tion était de com­pa­rer l’évolution de la pan­dé­mie entre les pays, mais je me suis rapi­de­ment ren­du compte que c’était impos­sible. Comme les méthodes de dépis­tage varient énor­mé­ment d’un pays à l’autre, en par­ti­cu­lier au début de la pan­dé­mie, il était évident que le nombre de nou­veaux cas ne per­met­tait pas d’établir une com­pa­rai­son fiable.

Je me suis donc inté­res­sé au nombre de décès. L’accès aux don­nées n’a pas posé pro­blème en France, où les deux prin­ci­paux ins­ti­tuts de sta­tis­tique – San­té publique France et l’Institut natio­nal de la sta­tis­tique et des études éco­no­miques (INSEE) – four­nissent quo­ti­dien­ne­ment des chiffres très pré­cis. Au fur et à mesure de la pro­gres­sion de la pan­dé­mie, les don­nées mises à dis­po­si­tion ont par ailleurs gagné en qualité.

Mal­gré tout, ces don­nées ne vous ont pas appor­té entière satis­fac­tion non plus. Pourquoi ?

Tout d’abord, bien que San­té publique France com­mu­nique d’énormes volumes de don­nées éma­nant des éta­blis­se­ments de san­té, celles-ci sont limi­tées puisqu’elles concernent uni­que­ment les patients hos­pi­ta­li­sés. Ensuite, pour ce qui est de l’INSEE, les chiffres des décès sur­ve­nus depuis mars sont très nom­breux, mais ils ne ren­seignent aucu­ne­ment sur les causes, ce qui les rend dif­fi­ciles à inter­pré­ter iso­lé­ment. En revanche, ces deux sources conju­guées apportent un éclai­rage pré­cieux sur la pro­gres­sion de la pan­dé­mie en France.

J’ai com­men­cé par com­pa­rer les chiffres de la mor­ta­li­té com­mu­ni­qués par l’INSEE les années pré­cé­dentes à ceux de cette année. Natu­rel­le­ment, on constate une aug­men­ta­tion : c’est le taux de sur­mor­ta­li­té, à savoir le nombre de cas sup­plé­men­taires par rap­port aux chiffres escomp­tés, lequel s’est avé­ré en moyenne 60 % plus éle­vé que celui des décès impu­tables à la Covid-19 four­ni par San­té publique France. Cette dif­fé­rence s’explique pro­ba­ble­ment en grande par­tie par la prise en compte des décès liés à l’épidémie sur­ve­nus en mai­sons de retraite. Elle pour­rait tou­te­fois être due à des causes connexes, comme le défaut de trai­te­ment d’autres patho­lo­gies liées à la pandémie.

Par la suite, j’ai ana­ly­sé les mêmes don­nées en éta­blis­sant une dis­tinc­tion entre hommes et femmes. J’ai consta­té que le coef­fi­cient pour les hommes était de 1,56, contre 2,40 pour les femmes. Rien de sur­pre­nant à cela, sachant qu’il y a en moyenne trois fois plus de femmes que d’hommes dans les mai­sons de retraite en France. Le fait que ces struc­tures soient beau­coup moins bien équi­pées pour recueillir et par­ta­ger des don­nées explique l’écart entre les chiffres.

Sur­mor­ta­li­té par rap­port aux décès dus à la Covid en milieu hos­pi­ta­lier pen­dant les semaines 13 à 15 de l’année 2020. Chaque point se rap­porte à une semaine, un dépar­te­ment et un sexe (hommes/femmes) donnés.

En fin de compte, cela vous a‑t-il per­mis de com­pa­rer les don­nées fran­çaises à celles d’autres pays comme vous l’escomptiez au départ ?

J’ai contac­té des confrères en Ita­lie, en Espagne, en Angle­terre et en Alle­magne. Mais aucun autre pays ne dis­po­sait de don­nées aus­si récentes que les nôtres. Ain­si, Public Health England, l’équivalent anglais de San­té publique France, n’a pas été en mesure de four­nir sys­té­ma­ti­que­ment des chiffres actua­li­sés, si bien que les cor­pus étaient beau­coup plus lacu­naires qu’ici. En France, nous avons ren­con­tré des pro­blèmes de ce genre par le pas­sé. La cani­cule de 2003 a entraî­né la mort de nom­breuses per­sonnes âgées. À l’époque, les don­nées publiques sur la mor­ta­li­té étaient moins four­nies, et ce sont les entre­pre­neurs de pompes funèbres, débor­dés, qui avaient tiré la son­nette d’alarme. Aujourd’hui, les don­nées sont faci­le­ment accessibles.

Vos tra­vaux ont uni­que­ment été publiés sur votre blog mais ils ont sus­ci­té un inté­rêt cer­tain. Com­ment les choses se sont-elles passées ?

Ce qu’il faut bien com­prendre, c’est que beau­coup de gens auraient pu en faire autant. L’analyse à laquelle je me suis livré est si simple qu’elle aurait pu être réa­li­sée par un étu­diant de pre­mier cycle. Elle montre tou­te­fois que la science des don­nées implique avant tout de dis­po­ser d’un cor­pus per­ti­nent. D’autres que moi sont arri­vés à la même conclu­sion, sans avoir connais­sance de mes tra­vaux. Des jour­na­listes spé­cia­li­sés du New York Times ont, par exemple, publié un article sur le taux de sur­mor­ta­li­té, qui a ensuite été repris par le Guar­dian et Le Monde.

De mon côté, j’ai été invi­té à par­ti­ci­per à une table ronde de l’Académie des sciences en pré­sence d’autres sta­tis­ti­ciens qui se consa­craient à divers aspects de la pan­dé­mie. Par ailleurs, un spé­cia­liste amé­ri­cain des don­nées, Gau­rav Sood, a pris contact avec moi. Il a publié sur son propre blog des tra­vaux encore plus appro­fon­dis à par­tir de mes ana­lyses, en cal­cu­lant l’âge moyen par décès dans dif­fé­rents pays. L’idée qui sous-tend cette démarche, c’est que beau­coup d’entre nous ont ten­dance à se dire que « ceux qui suc­combent sont âgés et seraient morts de toute façon ». À l’inverse, M. Sood a mon­tré que ceux qui sont décé­dés de la Covid-19 avaient per­du neuf ans d’espérance de vie en moyenne.

En dehors de l’Allemagne, très peu de pays dis­posent de don­nées tota­le­ment fiables concer­nant le nombre de cas. Dans cer­tains pays où les dépis­tages font défaut, comme en Boli­vie, le seul moyen de suivre l’évolution de la pan­dé­mie consiste à obser­ver la sur­mor­ta­li­té. La situa­tion de la France est en quelque sorte inter­mé­diaire. Nous béné­fi­cions de don­nées sur le nombre de cas, mais le taux de sur­mor­ta­li­té peut nous per­mettre de mieux inter­pré­ter les chiffres, en les com­pa­rant entre eux. Aux États-Unis, les cas de Covid-19 ne sont pas cor­rec­te­ment recen­sés. Il s’agit d’une ques­tion déli­cate sur le plan poli­tique. Selon moi, assu­rer le libre accès aux don­nées et leur trans­pa­rence est indis­pen­sable au bon fonc­tion­ne­ment d’une démocratie.

Vos conclu­sions sur l’analyse de la sur­mor­ta­li­té valent-elles tou­jours pour la deuxième vague ?

Les don­nées ne sont pas encore toutes dis­po­nibles : la deuxième vague est en cours et les chiffres sur la mor­ta­li­té, toutes causes confon­dues, sont publiées avec deux semaines de déca­lage. Cepen­dant, au vu des don­nées acces­sibles pour l’instant, il me semble que le phé­no­mène obser­vé lors de la pre­mière vague est moins mar­qué. En d’autres termes, la dif­fé­rence entre la mor­ta­li­té due à la Covid-19 en milieu hos­pi­ta­lier, d’une part, et la sur­mor­ta­li­té, d’autre part, est tou­jours pré­sente, mais elle est moins pro­non­cée. À ce stade, toute expli­ca­tion reste évi­dem­ment très hypo­thé­tique, mais il se peut tout sim­ple­ment que les EHPAD soient aujourd’hui davan­tage en mesure de faire face à l’épidémie.

Pour en savoir plus, allez sur le blog de Nico­las Cho­pin ici.

Propos recueillis par James Bowers

Auteurs

Nicolas Chopin

Nicolas Chopin

professeur de data science et machine learning ENSAE au Centre de recherche en économie et statistique*

Nicolas Chopin a soutenu sa thèse en 2003 (UPMC, Paris), a écrit ou co-écrit un livre et plus de 60 articles de recherche, dans les domaines de la statistique computationnelle, l'inférence Bayésienne, et l'apprentissage probabliste. Il est "fellow" de l'IMS (Institute of Mathematical Statistics), membre et ancien secrétaire de la section recherche de la RSS (Royal Statistical Society), et est ou a été éditeur associé des journaux suivants: Annals of Statistics, Biometrika, Journal of the Royal Statistical Society, Statistics and Computing, and Statistical Methods & Applications.
*CREST : une unité mixte de recherche CNRS, École polytechnique – Institut Polytechnique de Paris, ENSAE Paris – Institut Polytechnique de Paris, GENES

Soutenez une information fiable basée sur la méthode scientifique.

Faire un don