Institut Pasteur, enquête

Deux choses m'ont alerté. Que l'étude soit basée sur un taux de létalité et un de contagion pris comme constantes de l'équation alors que c'en est justement les inconnues. Ensuite qu'elle rapporte à la France ce qui a eu lieu dans l'espace clos d'un bateau !

L'Institut Pasteur c'est une institution. Et c'est seulement à l'instant que j'apprends que c'est une boite privée ! J'en reviens pas. Des instituts Pasteur il y en a partout dans le monde. Bref, je ne le savais pas quand il y a un mois, j'ai vu débarquer leur étude, estimant que 3,7 millions de français auraient été infectés...

Deux choses m'ont alerté. D'abord que l'étude soit basée sur un taux de létalité (0,5%) et un de contagion (3,3) pris comme constantes de l'équation alors que c'en est justement les inconnues ! (si on connaît le taux de létalité par exemple, une simple multiplication à partir des décès suffit à donner le nombre d'infectés). Ensuite qu'il soit question de rapporter à l'ensemble de la France ce qui a eu lieu dans l'espace clos d'un bateau !

Là-dessus le coordinateur du test est invité le soir même au journal de la 2. Et là, ô miracle, une Lapix en grande forme se retrouve à lui poser LA bonne question, à savoir comment il est arrivé à ces chiffres, s'il a pris les stats chinoises ou quoi ? Le type dit que non, puis lâche tranquillement qu'il se serait en fait calé sur des données observées "à partir de cas d'une croisière" ! Je bondis : 600 infectés par exemple à 0,5 % de létalité, ça fait 3 morts ! Ce serait à partir de 3 morts que Pasteur aurait fait ses statistiques ? Effarant. Et s'il y en avait eu 6, il serait passé de 0,5% à 1% de létalité ? Plus tard dans la soirée, je tombe sur l'exemple d'un bateau où justement, le taux de létalité est de 1% : le voilà mon contre-exemple ! Le bateau s'appelle le Diamond Princess : 700 personnes infectées et 13 morts : ni 0,5 ni même 1% en fait, mais finalement près de 2 % ! Pour finir, cerise sur le gâteau, j'apprendrai encore plus tard que c'est justement à partir de ce bateau que Pasteur a fait son étude...

Or à peu près au même moment débarque une autre étude, faite par l'EHESP et dont on a beaucoup parlé, car soutenant que si le confinement n'avait pas eu lieu, on aurait eu 60.000 morts de plus. Je n'ai ni les ordinateurs de ces gens ni leurs compétences, pas plus que les données à dispo, mais je m'aperçois qu'il y a un moyen de comparer les études à partir de données spécifiques à chacune des deux. J'arrive alors à des chiffres insensées et, ravi de mon effet, je mets ça au propre et l'envoie à un grand hebdomadaire pour que ça fasse du bruit. Pas pour frimer. Tout simplement que je ne supporte plus de voir les médias nous balader sans cesse, de voir qu'à chaque fois on semble occulter l'important, l'essentiel même (comme s'ils ne le voyaient jamais), et ce quel que soit le sujet. Bref, j'espère juste que le truc sera débattu (et tant pis si je me trompe et en fais les frais), que ça enclenchera quelque chose, des protestations de Pasteur, l'ouverture du débat, bref n'importe quoi plutôt que la soupe tiède de médias comme "aux ordres". J'envoie donc ceci :



L'inénarrable étude de l'Institut Pasteur

Après celle plutôt tartignole de Discovery, voilà qu'arrive à notre connaissance une autre étude tout aussi inénarrable, au point de se demander si l'on n'est pas en présence d'une machine savamment bidouillée afin d'être adaptée à l'absence de test en France. En gros et si j'ai bien compris, on tente de nous faire croire que des chercheurs ont rapporté toutes les informations qu'ils avaient sur le coronavirus sur un plan statistique, qu'ils auraient collé ces stats sur des données prises sur un bateau de croisière (le Diamond Princess, mis en quatorzaine en février avec 700 personnes infectées à bord), et auraient ainsi pu en déduire les chiffres de l'ensemble de la France !

Leurs chiffres semblent respecter le lot d'incertitudes auquel on est désormais habitué, sauf deux qui sont d'une précision absolue : un taux de létalité de 0,5% et un taux de contamination de 3,3. D'où ça sort, personne ne le sait. Et aujourd'hui, voilà que je m'aperçois qu'émerge un troisième chiffre, après lecture d'un article dont voici l'essentiel, résumé depuis Le Monde :

"Le confinement aurait permis d’éviter plus de 60.000 morts dans les hôpitaux, selon une étude publiée le 22 avril par des épidémiologistes de l’Ecole des hautes études en santé publique (EHESP). "Dans notre modèle, le nombre de décès quotidien double tous les quatre à cinq jours à partir du 19 mars, et atteint 10.000 morts le 19 avril", indique Pascal Crépey, qui a coordonné l'étude. Si le virus avait suivi son cours, 23% de la population aurait été infectée pendant cette période. Près de 670.000 patients auraient eu besoin d’être hospitalisés, et au moins 140.000 cas graves auraient dû être pris en charge, nécessitant plus de 100.000 lits de réanimation".

"Le nombre de décès quotidien double tous les quatre à cinq jours" et ils disent l'avoir prolongé. A partir de là, il est facile de déduire que leur taux de croissance exponentielle quotidien est de 0,17 (et donc qu'ils ont fait leur calcul à partir d'une exponentielle de 1,17). Et qu'ils partent des morts ne change pas grand chose : des morts ils déduisent les réanimations et les hospitalisations, et le chiffre des hospitalisations est assez proche de celui des testés positifs. L'institut Pasteur par contre utilise lui le chiffre de 0,3%, et est donc sur une exponentielle 1,3 (c'est écrit en page 13 de son rapport : "pendant une période de 45 jours, nous simulons une épidémie croissante à partir d'une seule infection, où le nombre de cas croît chaque jour avec un taux exponentiel de 0,3").
Quelle différence direz-vous ? C'est que c'est traître les exponentielles, et réfractaire à l'intuition. Ce chiffre donc, correspond à la contamination moyenne quotidienne par individu infecté. Aussi en regardant à quoi amène une croissance de 0,17 par rapport à une autre de 0,3, et ce sur 31 jours, on arrive à ceci : 128 environ pour la première ; 3340 pour la seconde ! Et si 128 se traduit par 6 fois plus d'hospitalisations et 60.000 morts de plus, 3340 amène en gros à 18 millions d'hospitalisations et 1,6 millions de morts ! Autant dire qu'il y a une des deux études qui raconte n'importe quoi ! Et pas sûr qu'il faille en rire...

C'est que ce genre de chiffres conditionne toute la validité de l'étude. Prenons 0,5%, soit le chiffre de la létalité. D'où sort-il quand si peu de gens ont été testés ? En l'absence de connaissance d'un virus, c'est bien le chiffre des décès par rapport aux infectés qui donne la probabilité de mourir et non une probabilité de mourir sortie d'on ne sait où qui ferait connaître le nombre d'infectés à partir du nombre de morts ! Ils peuvent bien tourner les choses comme ils veulent, c'est bien la probabilité de mourir, l'inconnue première ! Et voilà qu'à Pasteur ils semblent sortir ce chiffre de 0,5% de leur chapeau, comme s'ils l'avaient reçu d'une divinité. Au regard du fatras de précisions destinées à démontrer la rigueur scientifique avec laquelle ils ont procédé, on a droit en tout et pour tout à une malheureuse ligne qui évoque ledit chiffre : "Par ailleurs, écrivent-ils, l’étude estime que 0,5% des personnes infectées meurent". Fermez le ban ! Sauf qu'à ce compte, on peut remarquer que nul besoin d'étude aussi sophistiquée : 20.000 morts divisé par 0,5 = 4 millions d'infectés ! (je taquine un peu : les Ephad ne sont pas comptés, et à juste titre puisqu'ils obéissent à des lois différentes). On se demande quand même dans quel sens fonctionne leurs chiffres... et surtout leur logique !
Du coup tout le monde reprend bien sûr le chiffre de 4 millions d'infectés... alors que Pasteur lui-même admet une marge d'erreur, sortie là encore d'on ne sait où : en fait le nombre d'infectés serait de 2,3 à 6,7 millions, soit de 1 à 3 ! (et comme par hasard on revient là aux habituelles incertitudes quant aux chiffres)

Le deuxième chiffre c'est celui de la transmission du virus à partir d'un infecté, et là encore il est posé comme inamovible. C'est 3,3 et point-barre ! Pourquoi, comment... en dehors du fait que ça correspond précisément aux 70% d'infectés qui amèneraient selon certains à l'immunité collective ? Les deux chiffres sont cohérents puisque l'un dépend de l'autre, mais d'autres sont possibles. Or il se trouve qu'en matière de taux de transmission, les chiffres varient en gros de 2 à 9. Le chiffre chinois est de 2,2 et une étude de chercheurs américains l'estime entre 4 et 9. Saurait-on à Pasteur ce que le reste du monde cherche désespérément ? Et encore, il dépend des infectés asymptotiques et de ceux dont les symptômes sont pris comme sans gravité en France (en gros tout ceux qui arrivent encore à respirer). Or déjà pour les asymptomatiques, on a d'abord entendu le chiffre de 80%, et désormais il serait question de 30 à 60%. Se sont-ils seulement rendu compte à Pasteur que ce genre de donnée changeait tout ?



En réponse, un type du journal me dit que c'est "trop pointu pour notre lectorat" (sic). Pointu ? Quoi, les chiffres ? J'en déduis finalement que c'est de l'ironie, qu'il me prend pour une sorte de complotiste...

 

Que dire ? J'ai rien à changer ni du début ni de la fin.

Par contre, je me suis aperçu plus tard que la comparaison qui me ravissait tant en matière de chiffres avait de bonnes chances de ne pas tenir, et ce pour deux raisons. D'une part, elle est basée sur l'idée d'une contamination homogène sur l'ensemble de la France (alors que je pense maintenant qu'il faut différencier les régions très contaminées des autres), mais surtout parce que Pasteur n'a jamais dit que son taux quotidien de contamination valait pour la France ! Grosse erreur donc de ma part : il est bien dit qu'il s'agit d'une "simulation" et rien d'autre (ce qu'il en ont fait je n'en sais rien). Exit en tous cas mon million et demi de morts pour dix fois plus d'hospitalisés.

(il y a encore une erreur, petite cette fois : j'ai calculé sur 32 jours et non 31... ce qui ne change pas grand chose aux ordres de grandeur)

Donc je pense qu'il faut différencier par régions, que les logiques de contamination ne sont pas les mêmes. Pour faire comprendre on peut parler de zones rouges et vertes, où les stats sont parfois hallucinantes tant elles divergent (encore que rouge et vert soit grossier, plus on affinera plus on arrivera à des estimations précises). En fait, j'ai appliqué aux chiffres de contamination quotidienne moyenne d'un infecté une logique homogène qui courrait sur l'ensemble de la France, ce qui m'a amené à parler d'une croissance exponentielle de 0,17% pour l'EHESP qui, si elle n'est pas forcément fausse en tant que moyenne, n'a aucun intérêt. Il est tout à fait possible que l'étude ait justement raisonné en tenant compte des différences entre régions (je n'en sais rien en fait), et donc avec des chiffres plus importants en "zone rouge" et bien moins en "zone verte"... voire même qu'elle ait pris le même taux de contamination quotidienne (0,3%) que Pasteur, mais pour les seules régions très touchées. Ça ne dédouane pas Pasteur pour autant : je ne vois toujours pas comment raisonner à partir d'un bateau peut être compatible avec dissocier des logiques de contagions, ça sonne au contraire comme un aveu qu'ils ont tout mis dans le même sac. Je peux certes me tromper, en attendant c'est pas la réduction de leur estimation d'infectés de 4 à 3 millions qui m'incite à le penser...

 

Post-scriptum du 13 juillet :

Un élément que j'avais laissé passer démontre la pertinence de ma critique.
Je viens seulement de m'apercevoir que ce qui a modifié leur estimation d'infectés, c'est justement le chiffre de létalité, soit un des deux que j'avais largement critiqué, parce que pris comme une constante de l'équation alors que c'en est une inconnue !
Or entre la pré-étude et l'étude définitive (soit en l'espace de 3 semaines), ils sont passé d'une constante de 0,5 % de létalité à une autre de 0,7 % (sans plus d'explication que la première fois). Et ça correspond tout à fait  à la différence d'environ un million dans leur estimation. C'est donc bien en bout de leur chaîne de réflexion qu'ils font jouer le taux de létalité - qui est donc capital, puisqu'en reportant leur correction, ça impacte immédiatement l'estimation des infectés de façon proportionnelle. CQFD

 

Post-scriptum du 16 août :

J'ai parlé de "logiques différentes de contamination" qui pourraient rentrer en compte pour expliquer les différences énormes de propagation du virus selon les endroits du territoire. C'était plus une interrogation personnelle qu'une affirmation. Or je viens de tomber sur une étude (écossaise) qui pourrait aller dans mon sens, et qui explique que 90 % des porteurs pourraient n'être que très peu contagieux quand 10 % contamineraient 80 % des infectés... et là dedans quelques "super-propagateurs" seraient eux capables d'infecter des centaines de personnes (pour des raisons diverses pas encore toutes complètement élucidées dans le lien qui suit). La piste est toute fraîche et reste donc à suivre (je serai moi désabonné de Médiapart dans peu de temps et ne pourrai y revenir). En tous cas, voici le lien de l'étude qui est arrivé à ces résultats, sans garantie donc qu'elle résoudra le problème posé : https://www.lemonde.fr/videos/video/2020/08/15/covid-19-comment-certains-malades-deviennent-des-supercontaminateurs_6049016_1669088.html

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.