Accueil / Tribunes / Covid-19 : une mortalité plus élevée qu’il n’y paraît
Nicolas Chopin
π Santé et biotech π Société

Covid-19 : une mortalité plus élevée qu’il n’y paraît

par Nicolas Chopin, professeur de data science et machine learning ENSAE au Centre de recherche en économie et statistique*
Covid-19 : une mortalité plus élevée qu’il n’y paraît

    Depuis le début de la pandémie, les don­nées d’infectivité ou de mor­tal­ité liées à la Covid-19 mobilisent l’attention du monde entier. Pour­tant, aucun de ces deux paramètres n’est totale­ment fiable. En mars, lors du pre­mier con­fine­ment, Nico­las Chopin, pro­fesseur en sta­tis­tique et sci­ence des don­nées à l’École nationale de la sta­tis­tique et de l’administration économique (ENSAE) s’est lancé dans une analyse plus appro­fondie des chiffres four­nis par les autorités français­es. À l’instar d’autres chercheurs, il a décou­vert que les taux de mor­tal­ité de la Covid-19 étaient prob­a­ble­ment sous-estimés.

    Pen­dant le con­fine­ment, vous avez exam­iné les don­nées rel­a­tives à la pandémie sous un angle dif­férent. Qu’avez-vous constaté ?

    Au début de la crise, tout le monde ne par­lait que de la Covid-19 et je tenais à me ren­dre utile, d’une manière ou d’une autre. En tant que pro­fesseur en sta­tis­tique et sci­ence des don­nées, je me suis mis en quête de don­nées publiques. Au départ, mon inten­tion était de com­par­er l’évolution de la pandémie entre les pays, mais je me suis rapi­de­ment ren­du compte que c’était impos­si­ble. Comme les méth­odes de dépistage vari­ent énor­mé­ment d’un pays à l’autre, en par­ti­c­uli­er au début de la pandémie, il était évi­dent que le nom­bre de nou­veaux cas ne per­me­t­tait pas d’établir une com­para­i­son fiable.

    Je me suis donc intéressé au nom­bre de décès. L’accès aux don­nées n’a pas posé prob­lème en France, où les deux prin­ci­paux insti­tuts de sta­tis­tique – San­té publique France et l’Institut nation­al de la sta­tis­tique et des études économiques (INSEE) – four­nissent quo­ti­di­en­nement des chiffres très pré­cis. Au fur et à mesure de la pro­gres­sion de la pandémie, les don­nées mis­es à dis­po­si­tion ont par ailleurs gag­né en qualité.

    Mal­gré tout, ces don­nées ne vous ont pas apporté entière sat­is­fac­tion non plus. Pourquoi ?

    Tout d’abord, bien que San­té publique France com­mu­nique d’énormes vol­umes de don­nées émanant des étab­lisse­ments de san­té, celles-ci sont lim­itées puisqu’elles con­cer­nent unique­ment les patients hos­pi­tal­isés. Ensuite, pour ce qui est de l’INSEE, les chiffres des décès sur­venus depuis mars sont très nom­breux, mais ils ne ren­seignent aucune­ment sur les caus­es, ce qui les rend dif­fi­ciles à inter­préter isolé­ment. En revanche, ces deux sources con­juguées appor­tent un éclairage pré­cieux sur la pro­gres­sion de la pandémie en France.

    J’ai com­mencé par com­par­er les chiffres de la mor­tal­ité com­mu­niqués par l’INSEE les années précé­dentes à ceux de cette année. Naturelle­ment, on con­state une aug­men­ta­tion : c’est le taux de sur­mor­tal­ité, à savoir le nom­bre de cas sup­plé­men­taires par rap­port aux chiffres escomp­tés, lequel s’est avéré en moyenne 60 % plus élevé que celui des décès imputa­bles à la Covid-19 fourni par San­té publique France. Cette dif­férence s’explique prob­a­ble­ment en grande par­tie par la prise en compte des décès liés à l’épidémie sur­venus en maisons de retraite. Elle pour­rait toute­fois être due à des caus­es con­nex­es, comme le défaut de traite­ment d’autres patholo­gies liées à la pandémie.

    Par la suite, j’ai analysé les mêmes don­nées en étab­lis­sant une dis­tinc­tion entre hommes et femmes. J’ai con­staté que le coef­fi­cient pour les hommes était de 1,56, con­tre 2,40 pour les femmes. Rien de sur­prenant à cela, sachant qu’il y a en moyenne trois fois plus de femmes que d’hommes dans les maisons de retraite en France. Le fait que ces struc­tures soient beau­coup moins bien équipées pour recueil­lir et partager des don­nées explique l’écart entre les chiffres.

    Sur­mor­tal­ité par rap­port aux décès dus à la Covid en milieu hos­pi­tal­ier pen­dant les semaines 13 à 15 de l’année 2020. Chaque point se rap­porte à une semaine, un départe­ment et un sexe (hommes/femmes) donnés.

    En fin de compte, cela vous a‑t-il per­mis de com­par­er les don­nées français­es à celles d’autres pays comme vous l’escomptiez au départ ?

    J’ai con­tac­té des con­frères en Ital­ie, en Espagne, en Angleterre et en Alle­magne. Mais aucun autre pays ne dis­po­sait de don­nées aus­si récentes que les nôtres. Ain­si, Pub­lic Health Eng­land, l’équivalent anglais de San­té publique France, n’a pas été en mesure de fournir sys­té­ma­tique­ment des chiffres actu­al­isés, si bien que les cor­pus étaient beau­coup plus lacu­naires qu’ici. En France, nous avons ren­con­tré des prob­lèmes de ce genre par le passé. La canicule de 2003 a entraîné la mort de nom­breuses per­son­nes âgées. À l’époque, les don­nées publiques sur la mor­tal­ité étaient moins fournies, et ce sont les entre­pre­neurs de pom­pes funèbres, débor­dés, qui avaient tiré la son­nette d’alarme. Aujourd’hui, les don­nées sont facile­ment accessibles.

    Vos travaux ont unique­ment été pub­liés sur votre blog mais ils ont sus­cité un intérêt cer­tain. Com­ment les choses se sont-elles passées ?

    Ce qu’il faut bien com­pren­dre, c’est que beau­coup de gens auraient pu en faire autant. L’analyse à laque­lle je me suis livré est si sim­ple qu’elle aurait pu être réal­isée par un étu­di­ant de pre­mier cycle. Elle mon­tre toute­fois que la sci­ence des don­nées implique avant tout de dis­pos­er d’un cor­pus per­ti­nent. D’autres que moi sont arrivés à la même con­clu­sion, sans avoir con­nais­sance de mes travaux. Des jour­nal­istes spé­cial­isés du New York Times ont, par exem­ple, pub­lié un arti­cle sur le taux de sur­mor­tal­ité, qui a ensuite été repris par le Guardian et Le Monde.

    De mon côté, j’ai été invité à par­ticiper à une table ronde de l’Académie des sci­ences en présence d’autres sta­tis­ti­ciens qui se con­sacraient à divers aspects de la pandémie. Par ailleurs, un spé­cial­iste améri­cain des don­nées, Gau­rav Sood, a pris con­tact avec moi. Il a pub­lié sur son pro­pre blog des travaux encore plus appro­fondis à par­tir de mes analy­ses, en cal­cu­lant l’âge moyen par décès dans dif­férents pays. L’idée qui sous-tend cette démarche, c’est que beau­coup d’entre nous ont ten­dance à se dire que « ceux qui suc­combent sont âgés et seraient morts de toute façon ». À l’inverse, M. Sood a mon­tré que ceux qui sont décédés de la Covid-19 avaient per­du neuf ans d’espérance de vie en moyenne.

    En dehors de l’Allemagne, très peu de pays dis­posent de don­nées totale­ment fiables con­cer­nant le nom­bre de cas. Dans cer­tains pays où les dépistages font défaut, comme en Bolivie, le seul moyen de suiv­re l’évolution de la pandémie con­siste à observ­er la sur­mor­tal­ité. La sit­u­a­tion de la France est en quelque sorte inter­mé­di­aire. Nous béné­fi­cions de don­nées sur le nom­bre de cas, mais le taux de sur­mor­tal­ité peut nous per­me­t­tre de mieux inter­préter les chiffres, en les com­para­nt entre eux. Aux États-Unis, les cas de Covid-19 ne sont pas cor­recte­ment recen­sés. Il s’agit d’une ques­tion déli­cate sur le plan poli­tique. Selon moi, assur­er le libre accès aux don­nées et leur trans­parence est indis­pens­able au bon fonc­tion­nement d’une démocratie.

    Vos con­clu­sions sur l’analyse de la sur­mor­tal­ité valent-elles tou­jours pour la deux­ième vague ?

    Les don­nées ne sont pas encore toutes disponibles : la deux­ième vague est en cours et les chiffres sur la mor­tal­ité, toutes caus­es con­fon­dues, sont pub­liées avec deux semaines de décalage. Cepen­dant, au vu des don­nées acces­si­bles pour l’instant, il me sem­ble que le phénomène observé lors de la pre­mière vague est moins mar­qué. En d’autres ter­mes, la dif­férence entre la mor­tal­ité due à la Covid-19 en milieu hos­pi­tal­ier, d’une part, et la sur­mor­tal­ité, d’autre part, est tou­jours présente, mais elle est moins pronon­cée. À ce stade, toute expli­ca­tion reste évidem­ment très hypothé­tique, mais il se peut tout sim­ple­ment que les EHPAD soient aujourd’hui davan­tage en mesure de faire face à l’épidémie.

    Pour en savoir plus, allez sur le blog de Nico­las Chopin ici.

    Pro­pos recueil­lis par James Bowers

    Auteurs

    Nicolas Chopin
    Nicolas Chopin
    professeur de data science et machine learning ENSAE au Centre de recherche en économie et statistique*

    Nicolas Chopin a soutenu sa thèse en 2003 (UPMC, Paris), a écrit ou co-écrit un livre et plus de 60 articles de recherche, dans les domaines de la statistique computationnelle, l'inférence Bayésienne, et l'apprentissage probabliste. Il est "fellow" de l'IMS (Institute of Mathematical Statistics), membre et ancien secrétaire de la section recherche de la RSS (Royal Statistical Society), et est ou a été éditeur associé des journaux suivants: Annals of Statistics, Biometrika, Journal of the Royal Statistical Society, Statistics and Computing, and Statistical Methods & Applications.
    *CREST : une unité mixte de recherche CNRS, École polytechnique – Institut Polytechnique de Paris, ENSAE Paris – Institut Polytechnique de Paris, GENES