Covid 19 : Comment savoir si la situation sanitaire se dégrade ou s’améliore ?

Les mesures gouvernementales reposent sur des indicateurs censés refléter l'évolution de l'épidémie en France. Pourtant, comme on le verra ici, aucun de ces indicateurs n'est adapté à la situation actuelle, et il est délicat de mesurer l'évolution de l'épidémie. Certains indicateurs peuvent continuer à laisser penser à une aggravation même dans le cas d'une amélioration.

[Billet mis à jour le 19 septembre 2020]

La hausse du nombre de cas positifs détectés en France depuis quelques semaines, a suscité une inquiétude, de nouvelles mesures politiques, mais aussi de nombreux débats : ce nombre de cas positifs est-il un « indicateur » fiable, permettant de se faire une idée de la situation sanitaire ?

Précisons d’abord de quoi on parle : les tests sur lesquels Santé Publique France se base pour détecter les cas positifs sont les tests virologiques analysés en laboratoire. Par un procédé bio-technologique ("RT-PCR", ou "PCR"), ces tests détectent la présence de l’ARN du virus SARS-Cov-2 dans un prélèvement effectué avec un écouvillon à l'intérieur des fosses nasales. Des tests pourraient être effectués à partir d’un échantillon de salive, mais cette méthode, trop peu fiable, n’a pas été validée par le Conseil Scientifique (p.32).

Tests virologiques, tests sérologiques ?

Ces tests virologiques par PCR sont d’assez bonne qualité, dans la mesure où ils ont une spécificité proche de 100 %, c’est-à-dire qu’ils ne fournissent à peu près jamais de « faux positifs » : si on est testé positif, il est à peu près certain qu’on a trouvé de l’ARN viral dans notre nez, et qu’on est porteur du virus1.

À l’heure actuelle, ces tests PCR présentent toutefois quelques imperfections :

- leur sensibilité n’est pas très bonne, ce qui signifie que le nombre de « faux-négatifs » est loin d’être nul. On peut donc être porteur du virus et être testé négatif. Le nombre de cas positifs est donc toujours sous-évalué, sans qu’on sache précisément dans quelles proportions.

- lorsque du virus est détecté, le test peut donner une idée assez fine de la quantité de virus dans l’organisme, et donc du degré de contagiosité de la personne testée, mais il ne dit pas si on risque de développer une forme sévère ou non. Rappel : on peut être positif sans être malade et sans tomber malade par la suite. Lorsqu’on est positif, il est en fait plus rare d’avoir des symptômes que de rester asymptomatique. Mais, même asymptomatique, si on a le virus, on peut contaminer autrui.

- on peut être détecté positif alors que l’ARN que l’on a dans les fosses nasales correspond à des résidus de virus mort, et que l’on n’est ni malade ni contagieux. C’est le cas lorsqu’on a été porteur du virus et que notre système immunitaire l'a détruit, et on peut retrouver ces résidus jusqu’à deux mois après la contamination.

- lorsqu’on est détecté positif, à moins d’avoir des symptômes caractéristiques d’une des phases du Covid-19, on ne peut pas savoir si on a été contaminé il y a trois jours ou il y a deux mois. Cela ne témoigne donc pas forcément d'un niveau de circulation du virus « ici et maintenant ».

Il existe aussi des tests sérologiques, mais ils ne sont pas utilisés pour mesurer l’évolution de la pandémie. Ces tests cherchent à détecter la présence d’anticorps dans un peu de sang prélevé. Ils peuvent être effectués par des laboratoires d’analyses, ou avec des tests vendus en pharmacie, dont la fiabilité est sujette à caution.

Dans tous les cas, les tests sérologiques, qui cherchent à établir si on a développé une réponse immunitaire, ne permettent pas de dire si on est actuellement porteur du virus.

En conséquence, seuls les tests virologiques de type PCR sur prélèvement naso-pharyngé servent de base pour mesurer la diffusion de la pandémie sur un territoire. Une base de données nationale, "SI-DEP", a été mise en place pour recueillir et centraliser les résultats de touts les tests effectués en France par les laboratoires d’analyses et établissements hospitaliers affiliés à SI-DEP. C’est SI-DEP qui fournit les chiffres données chaque jour par Santé Publique France sur Géodes ou sur la page officielle mise en place par les autorités.

Comme on le verra, la façon dont la base de données SI-DEP est conçue et organisée a des conséquences sur les chiffres communiqués.

Mais commençons par poser le problème général. 

Si l'on était capable de savoir exactement combien de personnes sur le territoire sont porteuses du virus et susceptibles de le transmettre, et si l'on pouvait suivre l'évolution de ce nombre jour après jour, on pourrait savoir précisément si l'épidémie est en phase de régression ou de reprise. Seulement voilà : cela, on est incapable de le faire. Alors, à défaut de cette mesure exacte mais inaccessible, on peut se servir de tout ce que l'on peut vraiment observer, pour chercher à estimer le nombre de personnes portant le virus, ou au moins à savoir si ce nombre baisse ou augmente. Cela revient à considérer ce que l'on sait mesurer comme des indicateurs de l'évolution de l'épidémie.

Actuellement, quelles mesures, quels indicateurs, permettraient de savoir si l’épidémie est en phase de régression ou de reprise ?

Un indicateur qui resterait stable alors que le virus est en train d’infecter un nombre croissant de personnes chaque jour n’est pas satisfaisant : il ne permet pas de donner l’alerte.

Inversement, un indicateur qui peut « empirer » même lorsque la situation sanitaire s’améliore n’est pas satisfaisant non plus : il ne permet pas de donner l’alerte ou, plus exactement, il risque de donner l’alerte à mauvais escient, et de nous désensibiliser à une véritable alerte lorsqu’elle sonnerait.

Examinons les indicateurs dont nous disposons actuellement.

Le nombre de cas détectés

Certes on ne peut pas tester tout le monde tous les jours, mais chaque jour on peut tester un certain nombre de personnes. Chaque jour, on détectera donc des personnes porteuses du virus et la base de données SI-DEP en déduira un des principaux indicateurs actuellement utilisés : le nombre de nouveaux cas (aussi appelé nombre de cas positifs ou nombre de cas détectés.)

Le nombre de cas positifs est, à une date donnée, le nombre de patients dont le test PCR est pour la première fois enregistré comme « positif » dans SI-DEP. Le site Géodes 2 et la page dédiée le communiquent chaque jour, en le décomptant de plusieurs façons : nombre de cas positifs détectés au cours d’une journée ou d’une semaine, répartis ou non par tranche d’âge et par sexe.

Rappelons que le fait d’être testé positif pour la première fois un jour donné ne signifie pas qu’on a été contaminé ce jour-là : la contamination peut avoir eu lieu dans les deux mois précédents. Le nombre de cas positifs communiqué chaque jour comporte donc une sorte de « flou temporel » et ne peut pas être interprété comme un témoin de contagions ayant eu lieu sur une période trop précise, et encore moins comme une mesure des contagions « en cours ». Certains médias font donc — et entretiennent — une confusion lorsqu'ils annoncent "7000 contaminations en 24h" : lorsqu'ils s'appuient sur le chiffre publié chaque jour par Santé Publique France, il s'agit en fait de 7000 cas positifs enregistrés dans la base de données SI-DEP lors des 24 dernières heures, sans que l'on connaisse leur date de contamination. Et pour ajouter encore un peu de flou : les laboratoires prennent un certain temps à faire remonter leurs résultats vers la base de donnée, et les résultats reçus un jour par SI-DEP, correspondent à des tests effectués pour la plupart 3 jours avant, mais une partie significative des tests ont été effectués 4, 5, 6 ou même 10 jours avant leur enregistrement.

Par ailleurs, il est facile de comprendre que si l’on multiplie les tests de dépistage — ce que l’on est désormais en capacité de faire au niveau national (Fig. 1) — on multipliera les cas positifs détectés (Fig. 2), même s’ils sont en nombre stable ou légèrement décroissant dans la population. (Remarque : pour les Fig. 1 et 2, les jeux de chiffres communiqués ne commencent que le 13 mai 2020, et les courbes ne montrent pas la période de la « 1ère vague » de l’épidémie).

nb-tests-18-9
Fig. 1 (depuis le 13 mai - Géodes)


nb-pos-18-9
Fig. 2 (depuis le 13 mai - Géodes)


Lorsque le nombre de cas positifs augmente, ça ne veut donc pas forcément dire qu'il y avait moins de personnes infectées avant : ça peut simplement être dû au fait qu'on ne les voyait pas, parce qu'on ne les testait pas. Une petite partie de l'augmentation des cas positifs est également due au fait que des laboratoires d'analyses continuent de rejoindre 2 la base de donnée SI-DEP et d'y apporter leurs résultats.

Puisqu’il est directement influencé par nombre de tests de dépistage effectués, nombre qui résulte lui-même de paramètres techniques (disponibilité des tests) et de décisions sanitaires, administratives, économiques, politiques etc., le nombre de cas positifs détectés n’est donc pas un indicateur satisfaisant pour se faire une idée de l’évolution de la situation sanitaire.

Le taux d’incidence, le « R0 », la vulnérabilité des départements

Le « taux d’incidence » (le nombre de cas positifs détectés pour 100000 habitants, communiqué par Santé Publique France), le Reffectif (parfois appelé à tort "R0", et calculé en fonction des données observées), ou le niveau de « vulnérabilité » des départements reposent tous directement sur le nombre de cas positifs détectés.

Ils souffrent donc du même défaut : leur valeur dépend largement de la stratégie de dépistage. Même en cas de stabilité de l’épidémie, ces indicateurs peuvent augmenter et passer au rouge si on effectue davantage de tests, ou diminuer et passer au vert si on restreint le nombre de tests — ce qui, d'ailleurs, les rend potentiellement manipulables. Ils ne sont donc pas satisfaisants.

Le taux de positivité

Lorsqu'on entend dire que "le nombre de cas a augmenté plus vite que le nombre de tests", il s'agit en fait d'une référence au taux de positivité. Le taux de positivité, qui représente la proportion de personnes testées positives pour la première fois parmi les personnes testées, serait a priori un assez bon indicateur. En effet, comme le fait de multiplier les tests a de bonnes chances de multiplier le nombre de cas détectés dans des proportions semblables, en divisant l'un par l'autre on neutralise l'effet multiplicateur. Autrement dit : si on multiplie les tests, ça ne multiplie pas le taux de positivité.

Mais comme nous allons le voir, ce taux de positivité, du moins tel qu’il est obtenu en France, présente tout de même quelques défauts, qui ne le rendent pas aussi fiable qu’on le souhaiterait.

D'abord, puisqu'il est calculé à partir du nombre de cas positifs détectés, il garde ce "flou temporel" évoqué plus haut : il intègre des cas de contaminations plus ou moins récentes, et il serait illusoire d'y chercher une indication fine sur ce qui se passe en un lieu précis à un moment précis.

Qu'en est-il de son évolution au cours du temps ? Si le taux de positivité augmente, cela peut bien sûr être dû à une augmentation de la proportion de personnes contaminées, c’est-à-dire à une dégradation de la situation sanitaire.

Mais, même en cas de stabilité ou d’amélioration de la situation sanitaire, d’autres causes peuvent mener à des fluctuations du taux de positivité sans lien avec la situation sanitaire et, pour certaines, à une surestimation du taux de positivité, voire à son augmentation dans le temps.

En voici quelques exemples :

  1. Les progrès apportés à la sensibilité des tests, par exemple du fait d’un perfectionnement des écouvillons de prélèvement. En effet, de même que le nombre de cas positifs à partir duquel il est calculé, le taux de positivité est sous-évalué en raison des "faux-négatifs" dus à la sensibilité imparfaite des tests. Si un nouveau lot de matériel utilisé pour les tests donne une moindre proportion de faux-négatifs que les lots précédents, le taux de positifs sera moins sous-évalué, et la mesure du taux de positifs augmentera.

  2. Une habileté croissante des personnes chargées d’effectuer les prélèvements naso-pharyngés pour les tests : « L’expérience du CNR montre que la qualité de l’acte technique du prélèvement conditionne fortement la sensibilité de la détection ; des prélèvements faits le même jour chez un même individu par des préleveurs expérimentés et non expérimentés ne donnent pas les mêmes résultats. » (Source)

  3. La méthode de comptabilisation de la base SI-DEP conduit mécaniquement à une surestimation du taux de positivité fourni quotidiennement sur Géodes 2. Explication : les tests effectué un jour J et détectés négatifs ne sont pas tous comptabilisés dans le « nombre de personnes testées » ce jour J. En effet, pour le décompte, la base de données SI-DEP n'utilise qu’une ligne par patient, et la « date de test » figurant sur cette ligne n’est pas forcément modifiée lorsqu’un patient fait de nouveau un test :

    « 
    Précisions : Si plusieurs prélèvements sont rapportés pour un même patient :
    - Sélection de la première date pour les PCR ayant le même résultat (par exemple première date si plusieurs PCR négatives) 
    - Si PCR discordantes chez un même patient (N et P), la première PCR positive est conservée.
     »
    (Source, ou ici pour plus de détails.)

    Ainsi, le taux de positivité du jour J est le résultat de la division du nombre de personnes enregistrés positives pour la première fois dans SI-DEP au jour J, par le "nombre de personnes testées" au jour J, c’est-à-dire par le nombre de personne pour qui la date de test enregistrée dans SI-DEP est le jour J. Or, dans ce calcul, le dénominateur ne correspond pas au nombre réel de personnes testées le jour J : il lui est inférieur, puisqu’il ne comptabilise pas les personnes testées négatives au jour J si elles avaient déjà été testées dans le passé. Le résultat de la division est donc supérieur à la proportion réelle de personnes positives parmi celles qui ont été testées le jour J. Dit autrement : le taux de positivité indiqué par SI-DEP est surestimé.

    Exemple : si parmi 100.000 personnes testées aujourd’hui, on trouve 1000 personnes testées positives pour la première fois, et que, parmi les 99.000 cas négatifs trouvés, 20.000 personnes avaient déjà été testées, ces 20.000 personnes resteront affectées dans SI-DEP à leur première date de test négatif, et le calcul du taux de positivité pour aujourd’hui sera de 1000/80.000 = 1,25 %, au lieu des 1 % correspondant réellement à la proportion de nouveaux positifs parmi les personnes testées ce jour (1000 cas sur 100.000 tests.)

    Ce mode de décompte dans SI-DEP a même une conséquence étonnante : le taux de positivité devrait progressivement et inexorablement augmenter dans le temps, y compris si le nombre de personnes infectées chaque jour reste stable ou en lente décroissance. En effet, le nombre de personnes déjà testées au moins une fois augmente au fur et à mesure qu’on teste de nouvelles personnes, et les chances que des résultats négatifs soient écartés du décompte servant de dénominateur augmentent chaque jour.3

    Pour illustrer, on peut pousser le raisonnement jusqu’au bout : imaginons que toute la population se soit déjà fait tester au moins une fois, et qu’un jour où on re-teste 10.000 personnes, on en trouve 3 nouvellement positives ; alors SI-DEP ne comptabilisera pas les 9997 résultats négatifs, puisqu’ils auront déjà eu un test (négatif ou positif) dans le passé ; seuls les trois tests nouvellement positifs seront comptés à la date effective du test, et le taux de positivité affiché sera ce jour-là de 3/3 = 100 %, au lieu des 0,03 % auxquels ce résultat correspondrait réellement.

    Cependant, Santé Publique France publie également sur Géodes 2 un autre chiffre que le  nombre de personnes testées, ce qui permet de rectifier le calcul. Il s’agit du nombre de tests réalisés chaque jour, qui inclut, lui, tous les tests effectués, y compris sur les personnes ayant déjà un test enregistré dans le passé. On peut donc faire un calcul du taux « réel » de positivité à partir de ces chiffres : c'est le nombre de nouveau positifs détectés le jour J, divisé par le nombre de tests réalisés le même jour J. Si on fait ce calcul sur les dernières semaines, on observe deux choses (Fig. 3) :

    a) les courbes du taux de positivité calculés selon les deux méthodes s’écartent progressivement. A mi-seembre, on observe déjà plus d'1 point de différence entre les deux, c'est à dire 20% de surestimation du taux communiqué par rapport au taux que l'on cherche à connaître.
    surestimation-taux-18-9
      Fig.3 (Enzo Lolo d'après les données SI-DEP communiquées par Santé Publique France)

    b) les deux courbes ont été croissantes de mi-juillet à fin août, et sont incertaines depuis début septembre : le taux "officiel" (jaune) semble poursuivre une légère croissance, tandis que le taux rectifié (vert) stagne en moyenne.

  4. Les personnes contaminées à l’étranger et testées une fois (re)venues en France. Elles représenteraient 40 % des cas en réanimation en France (Source indirecte, à 11'35"). Et ce chiffre, forcément fluctuant, qui n’est pas dû à la circulation du virus en France, vient pourtant affecter le taux de positivité — de façon fluctuante —, brouillant la possibilité d’interpréter le résultat.

  5. Une modification de la répartition par tranche d’âge des personnes testées. Grâce aux chiffres de SPF, en appliquant une correction pour neutraliser les variations de cette répartition, on constate que l’impact est variable (Fig. 4). Il a parfois conduit à minimiser le taux, mais depuis fin juillet, c'est un phénomène inverse : le taux de positivité communiqué par Santé Publique France est surestimé par rapport au taux réel au sein de la population, d'environ 1/2 point. [Mise à jour du 18/09 : la surestimation due aux tranches d'âge est redescendue à environ 0,3 points]
    correction-tranche-demogr
      Fig. 4 (Enzo Lolo d'après les données SI-DEP communiquées par Santé Publique France et la démographie des tranches d'âge)

    L'explication est fournie par les deux figures suivantes : d'une part, on observe depuis quelques semaines un recours aux tests de dépistage qui n'est pas conforme à la répartition démographique : il est particulièrement marqué chez certaines tranches d'âge (les 20-49 ans) et rare chez les moins de 10 ans et dans la tranche 60-89 ans, comme l'illustre la Figure 5. (Les repères indiquent la proportion de chaque tranche d'âge dans la population française.)
    repart-tests-par-age-1
    Fig 5 (Enzo Lolo d'après les données SI-DEP communiquées par Santé Publique France)

    D'autre part, les catégories jeunes qui se font dépister massivement ont une proportion nettement plus élevée de positifs que les autres, ce qui crée une distorsion du résultat. Et cette distorsion est renforcée par le fait que les tranches qui se font moins tester ont un taux de positivité plus faible. Comme on peut le voir sur la Figure 6, les 20-29 ans ont un taux de positivité de 7%, alors que pour les 70ans et plus, le taux de positivité est proche de 2%.
    taux-par-tranche

    Fig. 6 (Enzo Lolo d'après les données SI-DEP communiquées par Santé Publique France)

  6. Une modification des stratégies de dépistage : on comprend aisément que tester des personnes prises au hasard donnerait un taux de positifs plus faible que de rechercher et tester les cas contacts des personnes détectées positives ; ou que tester uniquement les personnes présentant des symptômes donnerait un taux de positifs encore plus élevé. Changer de stratégie de dépistage, au niveau local ou au niveau national, aurait donc un effet sur le taux de positivité observé.

  7. Le taux de positivité départemental peut également être affecté par des contaminations ayant eu lieu ailleurs : les résultats sont en effet affectés par SI-DEP au département de résidence, et non pas au lieu de réalisation du test. Cela a un impact renforcé pendant les vacances. Ainsi, les résultats d’une campagne de dépistage ciblée, menée suite à une contamination collective dans un lieu fréquenté par les vacanciers (un bar sur la Côte d’Azur, un spectacle en Vendée...) ne se retrouveraient pas intégralement dans les chiffres des tests positifs du département où a eu lieu le rassemblement ; en revanche, ils feraient monter les taux d’incidence et de positivité des départements du domicile des vacanciers, y compris si ces départements ne connaissent pas d’activité du virus.
    Ce biais est toutefois neutralisé si l’on s’intéresse au taux de positivité national.

Puisqu'il dépend de nombreux paramètres plus ou moins contrôlables et mesurables, le taux de positivité peut être utile (à condition d'utiliser le nombre de tests effectués fourni par SI-DEP et non pas le nombre de personnes testées) pour évaluer un ordre de grandeur de la circulation du virus (afin de savoir si on est plus proche de 3% que de 20%) mais il n'est pas satisfaisant pour indiquer une tendance : ses fluctuations peuvent refléter tout autre chose que les variations du niveau de circulation du virus.

Le nombre d’hospitalisations pour Covid-19

Géodes, ainsi qu'une autre page officielle, fournissent également des chiffres résumant les données transmises par les hôpitaux. Parmi celles-ci, le nombre de nouvelles hospitalisations 2 pour Covid-19 donne une indication de l’intensité de l’épidémie (Fig. 7). Il est toutefois, dans une mesure difficile à estimer, susceptible d’être influencé par les comportements individuels, eux-mêmes pouvant dépendre de la communication officielle et médiatique. « Restez chez vous et prenez du Doliprane » ou « Au moindre signe, rendez-vous à l’hôpital » conduiraient à des différences dans le nombre d’entrées à l’hôpital, y compris pour un même niveau d’activité de l’épidémie. Autre exemple : maintenant que les tests sont largement accessibles, l'activité de dépistage augmente : en quelques semaines, on est passé de 35.000 tests par jour4 à plus de 150.000 par jour5, ; de plus en plus de personnes asymptomatiques, qui ne soupçonneraient rien sans une telle disponibilité des tests, se découvrent positives. Combien d'entre elles sont hospitalisées en raison de ce test positif, avec des symptômes qui ne les auraient pas conduites à l'hôpital sans le résultat positif d'un test ? Si ce cas de figure existe, alors il est probablement en augmentation depuis plusieurs semaines.
Par ailleurs, des anomalies dans les données peuvent fausser la lecture. Comme pour le nombre des décès (voir ci-dessous), des données saisies tardivement le 16/9 et le 18/9 ont pu exagérer l'impression de hausse résultant des courbes. La Fig. 7bis indique à quoi ressemblerait la Fig. 7 si on corrigeait les données correspondant à des dates anciennes et enregistrées tardivement les 16 et 18 septembre.

nouveaux-hosp-18-9
Fig. 7bis Fig. 7bis
Fig.7(Géodes)

Le nombre de décès

Lui aussi est fourni quotidiennement par Geodes 2 d’après les données transmises par les hôpitaux (Fig. 8), et c’est a priori l’indicateur le plus robuste de la gravité de l’épidémie, mais il réagit avec plusieurs semaines de retard. Une explosion soudaine du nombre de personnes infectées ne se verrait pas immédiatement dans les chiffres, et pourrait passer inaperçue pendant les jours cruciaux où il faudrait prendre des mesures d’urgence.

deces18-9
Fig. 8 (Géodes)

Il faut toutefois rester vigilants : comme pour les tests (enregistrés dans la base SI-DEP), le nombre de décès communiqués par Santé Publique France dépend de ce que les établissements hospitaliers enregistrent dans la base de donnée SI-VIC. L'adhésion de nouveaux établissements à SI-VIC peut conduire à une augmentation des chiffres quotidiens. Et il peut arriver que soient enregistrés en une seule fois, avec plusieurs semaines de retard, des décès qui en réalité s'étaient étalés dans le temps. Cela a été le cas pour au moins une partie des 19 décès enregistrés dans le Val d'Oise le 16 septembre, ainsi que le 18 septembre dans l'Essonne, avec 76 décès enregistrés ce jour-là alors qu'ils avaient eu lieu dans les semaines précédant le 26 juillet 2020. Au lieu de "+123 en 24H" (Fig. 9, bloc rose), il faut donc retrancher 76 décès, et comprendre "+47 décès en 24H". Certains médias n'ont pas pris la peine de lire l'avertissement (Fig. 9, en haut) publié par Santé Publique France.

dc123-18-sept

Fig. 9 (https://www.santepubliquefrance.fr/dossiers/coronavirus-covid-19/coronavirus-chiffres-cles-et-evolution-de-la-covid-19-en-france-et-dans-le-monde)

En tenant compte de ces "enregistrements" décalés par rapport aux dates réelles des décès, la courbe affichée au 18 septembre devrait donc ressembler à la Fig. 10. Environ 95 décès répartis sur des dates anciennes, mais non précisées (au moins 76 avant le 26 juillet), ne sont pas pris en compte dans cette courbe.

deces18-9-rect

Fig.10 (Enzo Lolo d'après les données et les explications fournies par Santé Publique France)

Le nombre d’entrées en réanimation

Géodes 2 le communique de la même façon que les précédents (Fig. 11). Peut-être est-il susceptible d’être influencé par d’autres facteurs (critères d’admission en réanimation, accueil ou non des pensionnaire des EHPAD…), d’inclure des patients contaminés hors de France et de ne pas comptabiliser les personnes hospitalisées à l’étranger alors qu’elles ont été contaminées en France, mais il reste un bon indicateur du degré de gravité de la situation sanitaire. Il réagit certes avec un retard de quelques semaines, moins long toutefois que le nombre de décès. Et depuis fin juillet, il montre une tendance à la hausse qui, sans être spectaculaire, ne peut pas être ignorée. Cette hausse ne permet pas de dire si elle se poursuivra, ni jusqu'à quel niveau, mais elle permet de prévoir que la hausse du nombre des décès va probablement se confirmer.

nouv-rea-18-9
Fig.11 (Géodes)

 

Autre difficulté : l’interprétation des courbes et les chiffres

Du fait du nombre et de la diversité des personnes et des situation, les phénomènes sanitaires ne sont pas le résultat d’un calcul mathématique, et ne suivent pas des courbes bien lisses. En-dehors des dynamiques de grande ampleur, il est généralement impossible de déterminer si une variation observée sur une courte période correspond à une tendance permettant d’anticiper l’avenir. Et plus on zoome sur les détails, plus on prend le risque de confondre ce que l’on appelle « bruit » en statistique avec une variation significative ou avec une tendance, et d’attribuer une cause (amélioration ou dégradation de la situation sanitaire) à ce qui n’est en fait que le résultat du hasard.

Et, comme ce billet tente de l’expliquer, un risque fondamental est de ne pas tenir compte des multiples facteurs qui entrent en jeu dans la valeur des indicateurs que l’on observe, et de les prendre pour un reflet exact et fiable du seul facteur qui nous intéresse.

Conclusions

Les indicateurs mis en place par Santé Publique France avaient une indéniable utilité dans les phase dynamiques de l’épidémie, ou lorsque n’étaient testées que les personnes présentant une suspicion de Covid-19 : ils ont permis de mesurer l’accélération exponentielle puis la redescente rapide de la courbe du virus, et d’anticiper quelque peu ces phénomènes. Ils ont encore d'autres utilités réelles sur un plan épidémiologique et médical. Mais dans une situation de plat ou de faux-plat de l'épidémie, ils sont sensibles à trop d’autres facteurs pour pouvoir servir de base à des analyses auxquels ils ne sont pas adaptés, et en tout cas pour être des indicateurs fiables du niveau de circulation du virus.

Plus ennuyeux encore, aucun des indicateurs actuels ne permettrait de constater à coup sûr que la situation s’améliore d’une semaine sur l’autre. Autrement dit : lorsque la pandémie est en phase de recul ou de disparition, on ne peut pas le savoir, parce qu’on n’a pas d’indicateurs pour l’observer « en temps réel ». Et on peut toujours croire que la situation empire (ou est sur le point d’empirer) : certains indicateurs pourront toujours nous le laisser penser. C’est sans doute ce qui se passait il y a 4 ou 6 semaines, lorsque les discours officiels et médiatiques ont commencé à alerter sur "l'augmentation" du nombre des nouveaux cas, qui ne se traduisent par une augmentation ni des courbes des décès ni des admissions en réanimation ces jours-ci ; est-ce ce qui se passe en ce moment ? Peut-être, mais… on ne peut pas le savoir avec certitude.

 

Un phénomène semble bien observable, en revanche : l’absence de socle irréfutable, à partir duquel on pourrait construire un consensus sur l’état de la situation sanitaire et sur les mesures adaptées pour en tenir compte, conduit chacun à se forger une « opinion » sur la situation sanitaire du pays, à partir des indices que tel ou tel indicateur peut sembler fournir. Une partie d’entre nous considère que la platitude des courbes de décès et d’admission en réanimation prouve bien que l’épidémie n’est plus une réelle menace mais que les politiques restrictives en sont une sérieuse (pour les libertés, pour l’économie, pour la santé psychologique...), tandis que d’autres voient dans la hausse du taux de positivité une preuve que nous sommes au pied d’une deuxième vague et considèrent les « réfractaires » comme une menace pour la vie des autres. Dans le clivage que cela suscite, sur fond de profondes inquiétudes, ces opinions ne peuvent alors que s’affronter sans fin, générant des divisions, parfois des ruptures, comme cela a déjà été le cas autour de chloroquine (pour des raisons semblables : les informations disponibles étaient nombreuses et contradictoires, sans élément solide qui eût permis de trancher en éclairant l’origine des contradictions et en mettant tout le monde d’accord.)

Le manque de clarté (et parfois de sincérité) des discours officiels, ainsi que le simplisme et les failles, souvent manifestes, dans les arguments justifiant des décisions politiques autoritaires et répressives, viennent jeter de l’huile sur le feu en crispant encore les positions. La haine et parfois la violence commencent à faire surface autour de ces questions.

Une menace supplémentaire est donc le risque d’affaiblissement de la solidarité qui sera nécessaire pour faire face aux politiques anti-sociales que nous réserve le gouvernement : que ce soit sur le droit du travail, la Sécurité Sociale, l’assurance chômage, les retraites etc., il faudra se mobiliser ensemble pour être efficaces…

Pour cette menace-là non plus, aucun indicateur n’est actuellement disponible.

 

 

 

1 Ce point reste à vérifier : les tests doivent être interprétés, et si le résultat se trouve dans une certaine frange, où il n’est ni clairement positif ni clairement négatif, un laboratoire pourrait le déclarer positif alors qu’un autre le déclarerait négatif. De plus, il est difficile de trouver des informations fiables sur la spécificité des tests, mais LCI parle de 95% de spécificité (à 3'50"). Une remarque, toutefois : si on savait que la spécificité est précisément de 95% en moyenne, on pourrait savoir que sur 100.000 tests effectués on trouverait environ 5% de positifs lié à ce défaut de spécificité, c'est à dire environ 5000 faux-positifs. Avec les 150.000 tests effectués chaque jour de semaine depuis fin août, c'est environ 7500 faux positifs par jour que l'on trouverait, c'est-à-dire à peu près la totalité des cas positifs découverts. Il est donc probable que la spécificité soit meilleure que 95%. Une étude la situe à 99%, et si ce chiffre était exact, on aurait environ 1500 faux positifs chaque jour pour 150.000 tests effectués. Il semble cependant qu'on ne connaisse pas la valeur précise (moyenne statistique) de la spécificité des tests PCR.

2 Sur les pages Géodes dont les liens figurent ici, on peut afficher la courbe temporelle à la place de la carte en cliquant sur « SYNTHÈSE ». [Addendum du 29/10/2020 : l'accès au "nombre de tests réalisés" a été supprimé de Géodes le 28/10/2020, jour de l'annonce du reconfinement. Cet indicateur n'est donc plus disponible. Cet addendum sera modifié lorsque l'accès sera rétabli. EDIT : l'accès au nombre de tests réalisés a été rétabli dès le 29/10 au soir.]

3 Remarque mathématique : les positifs du jour J ayant déjà été testés positifs sont exclus à la fois du dénominateur et du numérateur dans le calcul du taux de positivité affiché pour le jour J. Si la proportion de déjà-testés positifs et de déjà-testés-négatifs parmi les testés du jour J correspondait à leurs proportions respectives parmi les personnes déjà testées en général, le taux de positivité affiché refléterait davantage la proportion de positifs parmi les personnes testées le jour J. Mais les personnes déjà testées positives ont bien moins de raisons de faire un nouveau test que celles qui ont déjà été testées négatives. (Les faux-positifs étant réputés inexistants, et l’idée que si on a eu la maladie on est immunisé étant largement répandue, un test positif est a priori un événement conclusif ; en revanche, après un test négatif, on peut avoir besoin d’une confirmation en raison des risques de faux-négatifs, puis chaque fois qu’on pense avoir pu être contaminé.) Par conséquent, parmi les testés du jour J, les déjà-testés-négatifs seront sur-représentés par rapport aux déjà-testés-positifs, conduisant bien à une surestimation du taux de positivité.

4 Moyenne sur 7 jours consécutifs, du 15 au 21 juin.

5 Moyenne sur 7 jours consécutifs, du 24 au 30 août.

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.