CORONAVIRUS : LE CAS FRANCAIS

Après environ un mois de confinement, la France ne semble pas avoir encore dépassé le fameux « pic », et alors que certains signes montrent que la pandémie de coronavirus tend à se stabiliser, la mortalité continue paradoxalement à fluctuer sans raison. La France est-elle une exception ?

Dans son dernier Point épidémiologique hebdomadaire du 9 avril 2020, Santé publique France[1], qui publie les données officielles du Ministère de la Santé sur l’évolution de la pandémie de coronavirus dans notre pays, avait notamment indiqué une tendance à la stabilisation de la circulation du SARS-CoV-2, mais à un niveau élevé. Elle avait toutefois noté une diminution des recours à la médecine générale, à SOS Médecins et aux urgences hospitalières, tandis que les hospitalisations et admissions en réanimation des patients du COVID-19 restaient stables à des niveaux toujours élevés. En revanche, l’agence constatait une augmentation significative des décès toutes causes dans les régions Grand Est, Ile-de-France, Hauts-de-France, Bourgogne-Franche-Comté, Auvergne-Rhône-Alpes et Centre-Val-de-Loire. Cette dernière remarque semblait indiquer que la capacité des hôpitaux à accomplir leurs missions habituelles pour tous les autres types de maladies avait apparemment été atteinte par la priorité accordée au coronavirus.

Alors que le nombre de nouveaux cas de covid-19 admis en réanimation et d’entrées en hospitalisation continuaient d’augmenter en France, les chiffres de contamination par le virus dans les deux premiers pays affectés, les USA et surtout l’Espagne commençaient à marquer le pas, avec des décès en baisse, et certains y voient le signe d’un retournement prochain de la situation. Cependant, notre pays semble tarder à suivre la même voie et à sortir à son tour de cette condition. J’ai pour ma part lancé une petite étude personnelle sur l’évolution statistique de la pandémie afin de chercher à comprendre quelles pouvaient être les causes de la singularité du cas français.

Le modèle chinois

A cette fin, j’avais construit un petit modèle mathématique de comportement du virus qui permettrait, sinon de prévoir, du moins d’analyser les facteurs qui interviennent pour freiner l’évolution attendue. On peut retrouver cette étude dans mon billet de blog du 1er avril 2020[2], où j’ai expliqué la méthode choisie avec les hypothèses assez élémentaires qui ont été retenues. Pour l’essentiel, j’avais abouti à la conclusion provisoire que les écarts constatés par rapport au modèle théorique dans le cas français représentaient une forme de surmortalité « anormale » et relativement importante (+13,3 % de décès excédentaires à la date du 31 mars). L’aggravation de la situation était plus élevée qu’en Italie où le nombre total de décès était pourtant supérieur, mais où le redressement semblait être en bonne voie. J’avais alors émis l’hypothèse que cette situation était le résultat d’un état sanitaire plus dégradé dans notre pays. La question posée ici est de savoir si on peut encore confirmer cette leçon.

Un petit retour au modèle est nécessaire pour comprendre la logique du raisonnement. Il a été construit à partir de l’exemple chinois, premier pays rentré dans l’épidémie (dont il est certes à l’origine) et qui a fourni le profil de base de ce coronavirus à l’état « pur », c-à-d en dehors des influences extérieures qui peuvent modifier les conditions de son développement. En dépit de quelques problèmes de fiabilité statistique que d’aucuns ont soulevés au début de la publication des chiffres chinois (en raison de la nature du régime qui le prédispose aux critiques), mais qui ont été corrigés par la suite, il semble que l’épidémie du Covid-19 obéisse effectivement à ce mécanisme dans son principe intrinsèque qui a été admis par de nombreux épidémiologistes. Comme on peut le voir dans les deux graphiques ci-dessous, la forme de la courbe de la distribution réelle des décès (qui est la plus significative) suit à peu près celle d’une courbe de Gauss, et donc d’une Loi Normale qui représente la distribution idéale d’un phénomène discret soumis au hasard (courbe de gauche). On peut donc l’approximer ainsi[3].       

 

graphique-2
graphique-1

Pour l’utiliser de façon pratique, il convient de « lisser » les aspérités et accidents en regroupant par exemple les nouveaux décès par tranches d’une semaine qui font mieux ressortir le caractère gaussien de cette distribution (courbe de droite), avec un axe réparti sur les 9 semaines qui correspondent à la durée moyenne du cycle, et une forme de la courbe descendante un peu particulière que l’on retrouve en général dans tous les cas observés (avec un étalement en queue de comète).

 

graphique-3

 

On obtient ainsi un « modèle » théorique simplifié (graphique ci-dessus) à partir duquel on peut faire l’analyse du comportement-type de l’épidémie et/ou du virus sur les pays choisis.

L’application à 3 pays

En gardant en tête ce schéma idéal, on peut analyser le profil de l’épidémie sur les trois pays où elle s’est d’abord développée massivement, la Chine, l’Italie et la France (cf. les 3 graphiques comparatifs qui suivent). J’ai été amené à faire les remarques suivantes (à la date du 11 avril) :

  1. On peut tout d’abord noter que l’épidémie se propage de la même façon dans les 3 pays, avec un retard dans le temps assez variable, qui dépend de la date de début avéré (en Chine c’est le 23 janvier qui est souvent cité par les sources[4]). Le profil chinois semble justifié.
  2. Pour chaque graphique, j’ai superposé la courbe des décès à celle des cas enregistrés. Les échelles sont différentes (sur 2 axes) afin de rendre comparables les courbes.
  3. Dans chaque pays, la variable la plus significative est la courbe des décès, qui suit assez bien le profil du modèle, mais la comparaison entre les deux courbes est très révélatrice. On note un certain décalage apparent entre le pic (ou la valeur modale) des cas observés et celui des décès, de l’ordre de 10/12 jours (12-23 février) pour la Chine, de 6 jours environ (21-27 mars) pour l’Italie et peut-être de la même durée pour la France (03-09 avril).

 

graphique-4

  1. Toutefois, la notion de « pic» reste floue. Il peut être pragmatiquement défini comme le moment où le nombre de nouveaux cas diminue nettement (sans remonter au même niveau)[5], mais il est plus sûr à mon avis de s’appuyer sur le nombre des décès qui est humainement plus significatif. Quoi qu’il en soit, il est parfois plus pertinent de parler de « plateau » quand le sommet correspond à plusieurs petits pics (« décès » en Chine, « cas » en Italie ou en France), et le pic sera alors une variable intermédiaire de l’intervalle à déterminer après coup.
  2. Un autre grand intérêt de cette présentation est montrer l’intervalle de temps entre le pic estimé des cas et celui des décès. Plus la durée est longue, plus elle exprime l’idée d’un retard de la réponse sanitaire par rapport au sommet « naturel» de l’épidémie. Celui-ci serait donc d’une dizaine de jours pour la Chine, de l’ordre de 6 jours pour l’Italie, mais il est difficile à définir pou la France tant la courbe est hachée…
  3. C’est ce qui nous amène à poser le cas français, où le retard est important, la surmortalitée plus élevée, et surtout où l’ampleur des fluctuations des décès réclame une analyse spécifique.

La spécificité française

J’ai tenté dans les graphiques qui suivent de mettre en évidence les particularités de la situation de l’épidémie en France, qui sont nombreuses et problématiques, même en cette période pascale.

 

graphique-5

 

Si l’on regarde l’évolution générale de la courbe des cas recensés officiellement en France, on ne peut s’empêcher de noter les irrégularités en fin de période, avec un net saut le 3 avril, qui correspondent à des difficultés d’enregistrement statistique dus à une modification de la méthode de collecte et de calcul des données. En effet, les chiffres officiels n’enregistraient jusqu’au 2 avril que les cas et décès comptabilisés dans les hôpitaux et laissaient de côté les EHPAD et autres établissements sanitaires, sous l’assertion que les pensionnaires souffrent souvent de plusieurs types de morbidité associés et décèdent donc de causes indéterminées qu’on ne peut attribuer au seul Coronavirus.

 

Sous la pression des organismes internationaux et de l’opinion éclairée, les autorités sanitaires françaises ont décidé d’intégrer les données des EHPAD dans les séries publiées à partir du 2 avril. Cela a créé un saut important dans la série des décès (+ 884 dans les seuls EHPAD le 2 avril, soit 22 % du total des décès, puis 1.416 le lendemain, en augmentation de 60 %), et dans celle des cas (17.827 de plus issus des EHPAD le 3 avril, soit plus de 30 % du total des cas enregistrés en un seul jour). La conséquence immédiate, en dehors de la volatilité accrue des chiffres, est de rendre les séries complètement hétérogènes et impossibles à comparer d’une période sur l’autre. Il va probablement falloir attendre un peu de temps avant que les autorités sanitaires ne soient en mesure de reconstituer des séries homogènes qui reflètent la réalité sanitaire.

 

En outre, et on le verra plus loin, il est fort probable, si l’on en croit les commentaires de certains observateurs, que la totalité des décès dus au COVID-19 ne soit pas comptabilisée, car à côté des hôpitaux et des EHPAD subsiste une troisième source de données sur la mortalité qui est très mal connue, les décès intervenus au domicile des patients et qui n’ont pas été, ou pas encore, attribués à cette pandémie dont les symptômes généraux peuvent être aisément confondus avec ceux d’autres maladies, en l’absence de tests de dépistage qui peuvent seuls attester de l’infection au coronavirus. De nombreuses sources statistiques se posent la question. A mon avis, il faudra sans doute attendre quelques mois le verdict de l’INSEE qui comparera avec le profil de la mortalité « normale », ou attendue, afin d’estimer l’ampleur de la surmortalité qu’on peut raisonnablement attribuer au virus.

 

graphique-6

 

Si l’on regarde dans le graphique ci-dessus l’évolution (sous la forme d’indices pour tenir compte de la différence d’échelle entre les séries) du nombre de cas enregistrés comme tels (chiffre d’ailleurs discutable en France, comme dans d’autres pays ou les critères peuvent varier), et qu’on la compare à celle du nombre des décès, sous réserve des remarques formulées précédemment à propos de la prise en compte tardive des EHPAD, on constate bien une accélération du rythme de la mortalité qui dépasse l’apparition des cas. Fort logiquement, les deux courbes se croisent exactement au moment où les EHPAD apparaissent dans les séries, et où la mortalité en particulier connaît un bond important, qui n’est peut-être qu’un artefact statistique… Toujours est-il que celle-ci tend à s’accroître alors que les cas progressent moins vite et que la contagion tend à s’atténuer. Cela confirme mon intuition initiale.

 

graphique-7

 

Le graphique suivant (ci-dessus) témoigne bien du saut opéré par cette intégration des EHPAD dans les séries de coronavirus. Plus précisément, il s’agit ici du ratio Nombre de Décès/ Nombre de Cas, et de la comparaison entre le calcul du taux en moyenne, qui lisse le phénomène sur l’ensemble de la période, et le taux journalier, qui met en évidence le supplément exceptionnel de décès autour de la date du 2-3 avril. On notera également avec intérêt que le ratio n’est pas stable en temps « normal ». Il tend en effet à diminuer au début de l’épidémie, pour atteindre un taux de mortalité apparent qui s’établit en moyenne autour de 2 %-2,5 % (dans un intervalle de 1 % à 4 %) des cas au cœur du phénomène, avant de remonter progressivement vers le niveau actuel de 9 % à 10 %. On notera enfin que le ratio journalier (celui des nouveaux décès) est bien plus fluctuant que le ratio moyen (même si l’on fait abstraction du phénomène EHPAD qui accentue l’instabilité du taux), ce qui montre la très grande volatilité du nombre des décès. C’est par ailleurs un schéma de courbe en U que l’on constate également dans les autres pays, ce qui laisse à penser que le nombre de cas réel est statistiquement sous-estimé si l’on admet, comme l’affirme le corps médical, que la mortalité du virus devrait être a priori constante… Cette remarque explique à mon sens la difficulté des autorités médicales pour déterminer avec précision le taux de mortalité du virus, et entretient le doute sur les modes de calcul.

 

graphique-8

 

Dans les deux graphiques qui suivent, on peut nettement voir la distinction opérée par la « correction » statistique française à travers l’ajout des EHPAD entre l’avant et l’après. Cela joue autant sur la série des décès cumulés (ci-dessus) que sur celle des nouveaux décès qui sont enregistrés journalièrement (ci-dessous). Si l’on se limitait à la seule série originelle des décès cumulés, qui ne concerne en réalité que les hôpitaux, on observerait une belle courbe « logistique » vers laquelle tendent tous les pays qui sortent progressivement de la pandémie (cas de la Chine, de l’Italie vraisemblablement, et peut-être même de l’Espagne). C’est encore plus vrai pour les nouveaux décès, qui suivent logiquement une distribution de plus en plus gaussienne comme le modèle théorique. Cependant, l’ajout des données des EHPAD est un facteur perturbateur important du fait des grandes fluctuations de celles-ci qui augmentent considérablement la volatilité de la série, et lui donnent un caractère imprévisible.

 

graphique-9

 

Pour toutes ces raisons, que notre étude statistique met en évidence, la sortie de crise du cas français qui pouvait apparaître proche à partir des séries calculées de manière erronée sur la seule mortalité des hôpitaux est désormais noyée dans un brouillard statistique d’où l’on ne peut tirer aucune prévision fiable. Les nouvelles séries ne sont ni complètes, ni homogènes, et un doute subsiste sur la capacité de l’appareil statistique dans sa forme actuelle à fournir des chiffres cohérents et indiscutables.

Une conclusion fragile et provisoire

Les données présentées au moment où je rédige ce texte datent du samedi 11 avril, et les éléments d’information ultérieurs pour les deux jours qui suivent sont, de l’aveu même des sites statistiques consultés, de qualité médiocre et incomplets. Cette situation est attribuée à la période pascale qui se prête mal au recueil statistique. Cela reste néanmoins un peu étonnant pour la France alors que les dernières données de l’Italie (qui datent du 12 avril) sont assez correctes et que notamment le nombre des nouveaux cas (+4.092 contre +4.694) et celui des nouveaux décès (+431 contre +619) continue de baisser, donnant une allure gaussienne plus nette à la courbe et confortant encore plus l’idée de la sortie de crise pour ce pays, en dépit des valeurs élevées déjà atteintes.

 

En France, le schéma est très différent et l’on ne peut que s’interroger sur les causes de cette permanence d’un nombre toujours élevé et surtout fluctuant de décès, alors que d’autres pays, certes entrés plus tôt dans la pandémie (et encore la question se pose pour l’Espagne qui semble un peu mieux s’en sortir), donnent l’impression d’avoir passé le cap dangereux et de pouvoir envisager sereinement le déconfinement. C’est d’autant plus surprenant que le nombre de nouveaux cas déclarés, sous réserve qu’ils soient bien estimés, tend effectivement à suivre la même tendance gaussienne qui indique une probable sortie de crise depuis le début du mois d’avril. Cette contradiction flagrante entre un pic « épidémique » apparemment atteint et un nombre élevé et très volatil de décès, qui se prolongent dans le temps, ne peut qu’affirmer le contraire et suggère plusieurs causes possibles à cette spécificité :

  • Tout d’abord, un biais statistique évident avec un champ d’information réduit au départ (sans les EHPAD) et mal corrigé en cours de route, qui laisse de nombreuses interrogations…
  • Des méthodes de collecte de l’information confuses et mal coordonnées qui accentuent ces défauts, qui ne semblent pas se clarifier avec le temps,
  • Des définitions discutables qui ont elles-aussi fluctué dans le temps,
  • Une politique de gestion de la crise au jour le jour, pour le moins maladroite, qui donne un taux élevé de mortalité par habitant à peine inférieur à celui de l’Italie et de l’Espagne, mais avec 3 à 4 fois moins de tests que ses voisins,
  • Des choix sanitaires comme le confinement tardif qui s’expliquent d’abord par l’absence ou l’insuffisance criante des équipements (lits, masques, tests) et des personnels, et qui visent à masquer une incurie plus profonde qui n’a pu être redressée à temps,
  • L’accumulation depuis des décennies de politiques de santé irrationnelles (tarification à l’acte, rentabilisation systématique des établissements hospitaliers, etc.) qui ont laissé un système sanitaire délabré et incapable de soutenir l’épidémie.

C’est tout cela que les « aberrations » statistiques constatées ont mis en évidence, à travers une surmortalité exceptionnelle qui a considérablement accru la gravité de la crise pandémique.

 

 

[1] Santé publique France, dans le cadre de ses missions de surveillance et d’alerte, analyse les données de surveillance de COVID-19 issues de son réseau de partenaires : médecins libéraux, SAMU, Centre 15, SOS médecins, médecins urgentistes, réanimateurs, laboratoires de biologie médicale hospitaliers et de ville, Agences régionales de santé (ARS) et épidémiologistes. Le bilan qu’il présente ici est basé sur les données épidémiologiques rapportées jusqu’au 07 avril 2020.

[2] Cf. le lien suivant : https://blogs.mediapart.fr/jfvacher/blog/010420/coronavirus-quand-en-sortirons-nous

[3] La courbe d’ajustement (en rouge) correspond à une équation polynomiale de degré 5.

[4] J’ai privilégié le site www.worldometers.info qui collecte et synthétise les sources primitives pour les diffuser ensuite.

[5] Les épidémiologistes diffèrent sur cette définition en fonction du poids accordé aux autres variables (hospitalisation, réanimation, etc.), et s’interrogent sur la date du retournement. J’ai présenté ici mes choix, qui sont arbitraires…

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.