Réflexions d’un béotien en statistique médicale
Discordance entre deux études d’impact du confinement à la française
L’étude épidémiologique de l’EHESP, datée du 22 avril[1], arrive à des conclusions pour le moins surprenantes en évaluant à plus de 60’000 décès hospitaliers épargnés en France par les mesures de confinement entre le 19 mars et le 19 avril. Cette somme interpelle car, du début de l'épidémie au 31 mars, l'évaluation publiée par l'Imperial College britannique associé avec le bureau compétent de l'OMS (voir le rapport en anglais No 13), estime pour la France le nombre de décès épargnés par ces mêmes mesures à environ 2’500 avec un intervalle de confiance à 95% de [1000-4800].
Correction estimée pour prolongement entre le 1er et le 19 avril
Le confinement (« lockdown ») proprement dit a certes débuté en France le 17 mars, mais certaines mesures avaient été prises auparavant depuis le 13 (interdiction des rassemblements et manifestations publiques), le 14 (fermeture des écoles) et le 16 (distance physique), et on comptait déjà 175 décès le jour du confinement, 264 le lendemain, jour auquel on franchissait aussi la barre des 100 décès quotidiens. A la fin du mois de mars[2], le rythme des décès battait son plein aux alentours des 500 pour atteindre le pic de 605 le 6 avril. Il est donc normal qu’aux 2500 décès estimés épargnés à fin mars se surajoutent ceux qu’auraient causés entre le 1er et le 19 avril la poursuite non freinée des décès soit, si l’on prend le pic du rythme 605 morts/j x19 jours = 11'495 à défalquer des morts effectifs sur la période soit 12'069 décès au 19 avril - 3’523 au 31 mars = 8’546 décès, ce qui donne 11'495 – 6'546 = 2’949 décès supplémentaires obtenus en prolongeant sur 19 jours le rythme quotidien de pointe atteint avant que le confinement contribue le à décélérer. Cette valeur est évidemment approximative car l’estimation des décès est basée sur un prolongement linéaire (pente constante) au 6 avril rétroprojeté à partir du 1er. On a donc 6 jours, un tiers d’intervalle, ou la droite est en dessus de l’exponentielle, et 12 jours (deux tiers) où elle est au-dessous. Le coefficient de cette exponentielle dépend du taux de contamination R estimé par les modèles respectifs avant le début de mesures de distanciation disons au 15 mars. Nous ne savons pas recalculer les modèles pour les transposer aux mêmes dates, mais pour équilibrer en durée les deux régions sur, on peut reculer la sécante de 3 jours au 28 mars, ce qui rajouterait 605*3=1'815 décès supplémentaires et un delta final de 2'949+1'815 = 4’764. Nous concluons pour faire bonne mesure que l’estimation du modèle britannique aboutirait à un surplus de décès de 5'000 + 2'500 soit de 7'500 vies épargnées dont 5’000 entre le 1er et le 19 avril. Evidemment nous ne pouvons statuer sur ce que serait devenu l’intervalle de confiance et nous sentons bien incapables de comprendre les origines d’une telle distorsion, dans les modèles très différents utilisés par les différentes équipes de statisticiens. Peut-être tient-elle dans les intervalles de confiance des coefficients R de transmission (« reproduction coefficient ») estimés hors confinement pour les différentes régions, qui ne sont pas indiqués. Apparemment les intervalles de confiance pour le nombre de décès graphiquement grisés sont bien plus larges dans le modèle EHESP que dans le modèle britannique.
Un modèle apparemment mal calibré
On peut lire ceci dans le cadre qu’un article consacre aux conclusions de l’EHESP.
Agrandissement : Illustration 1
Leur modèle donnerait en date du 19 avril un taux journalier de 10'000 décès. Cela nous paraît extravagant si l’on songe qu’au pic des décès le 6 avril, on en notait 605. Or le texte affirme que depuis la mi-mars, donc juste après confinement, le nombre exponentiel de décès quotidiens doublait tous les 4 à 5 jours, soit de moins d’un facteur 4 par semaine. Comme les décès sont en moyenne décalés de plus de trois semaines[3] de l’infection, la décélération du rythme des décès due au confinement ne pouvait se faire sentir avant le 6 avril, que trois semaines exactement séparent du 16 mars, ce qui est vérifié en France puisque il s’agit du pic de l’accroissement quotidien. On peut aussi vérifier que ce pic de 605 correspond en effet approximativement à un doublement tous les 4 à 5 jours[4] en trois semaines des décès enregistrés aux alentours du 16 mars. En prolongeant exponentiellement, à ce rythme d’avant effet de confinement jusqu’au 19 avril, donc de 13 jours, la valeur du pic, on obtient 605 x 2^(13/4.5) = 605 x 7.41 = 4481, donc moins de 4500 décès au 19 avril, et non 10'000. Selon ces calculs relativement simplistes, le modèle prédictif du nombre de décès à l’hôpital hors effet du confinement utilisé par EHESP apparaît décalé d’au moins 5 jours, soit une erreur de plus du double par rapport aux observations.
Conclusion
J’ai d’abord cru à une confusion des journalistes entre l’Hexagone et les 11 pays européens de l’étude anglaise, qui totalisaient en effet 59’000 morts épargnées dans l’étude référencée, faisant le buzz sur les réseaux et aussitôt exploitée par le gouvernement et toute la presse de révérence. Mais non, après avoir difficilement mis la main sur l’étude publiée par l’EHESP, je me dois de déchanter. En effet, les statisticiens émérites de l'EPHSP connaissent le travail de l’Imperial College, qu’il citent, et prétendent que les résultats de leurs modèles respectifs sont consistants (« consistent ») avec la valeur de 4800 donnée par leurs collègues. Voici l’extrait concerné de leurs conclusions.
« The results presented here, suggesting an important impact of the lockdown, are consistent with other studies. Flaxman and colleagues, used a semi-mechanistic Bayesian hierarchical model to attempt to infer the impact of control interventions across 11 European countries, including France. They estimated that the lockdown managed to reduce the reproduction number below one, and that, up to March 31 only, up to 4,800 deaths might have been averted (56% relative reduction). »
Or il s’agit de la borne supérieure pour laquelle leurs collègues ont estimé qu’elle n’a que 5% de vraisemblance. Le « up to » tient évidemment de l’euphémisme, pour juger consistants des modèles en se calant sur la borne supérieure des intervalles de confiance et non sur la valeur estimée la plus vraisemblable. De qui se moque-t-on en affichant plus de 8 fois le nombre de vies épargnées selon un modèle d’émérites collègues internationaux ? Evidemment, prétendre que le confinement a sauvé au moins le quintuple de vies que le nombre de décès enregistrés en hôpital (12'509 au 19 avril) était une tentation peut être irrésistible. Redorer le blason du gouvernement par un chiffre qui court maintenant les réseaux sociaux et a été fièrement exhibé à France-Inter ce midi 24 avril par Olivier Véran, mérite-t-il de ne pas même s’interroger sur les discordances entres les modèles et de claironner ce qui risque de finir en « fake news » d’un nouveau genre, voire discréditer leurs auteurs et ceux qui se jettent sans le moindre recul sur ces résultats ? Je n’affirmerai pas que ce sont les mêmes qui exigent depuis plus d’un mois l’interdiction de prescription précoce de l’hydroxychloroquine préconisée urgemment en association avec l’azithromycine par l’IHU marseillaise et son directeur Didier Raoult, en exigeant des validations dites scientifiques de variantes dont ce dernier rejette les conditions d’administration ou la posologie, mais le soupçon est permis.
Au moment où certains continuent à douter sinon de l’opportunité du confinement, du moins de sa mise en œuvre, et à questionner les restrictions aux libertés qu’il entraîne et risque encore d’accroître et pérenniser pour en sortir, le sauvetage des vies a l’indiscutable privilège de faire taire les critiques. Gonfler a posteriori les vies épargnées, voilà qui efface tout débat sur les morts qu'une politique alternative aurait pu éviter.
Dario Ciprut, 25 avril 2020
[1] Attention : le nom du fichier pdf auquel renvoie l’EHESP porte, contrairement au rapport lui-même, la date du 22 mars !
[2] Ces données sont extraites des tableaux quotidiennement mis à jour sur de déploiement de la pandémie dans Le Monde rubrique Covid-19 des décodeurs.
[3] 23.9 jours en moyenne séparant l’infection de la mort selon le modèle de l’Imperial College, qui assume une dynamique de la maladie semblable sur les 11 pays examinés. La distribution obtenue par l’EHESP résulte d’estimation régionales différentiées selon l’âge des personnes infectées, la valeur moyenne résultante pour la France n’étant pas documentée.
[4] Un doublement tous les 4.5 jours correspond en 3 semaines ou 21 jours à un facteur de 2^(21/4.5) = 25.4