Etienne Pardoux : Modèles mathématiques des épidémies

Etienne Pardoux, Professeur émérite à Aix Marseille Université, nous parle de modélisation mathématique des épidémies.

Les mathématiques détaillées et explications sont dans le texte qui suit !

Introduction

Etienne Pardoux : Nous vivons en ce moment une pandémie mondiale inédite. Une addition d’épidémies dans chaque pays, qui se sont répandues par les transports aériens, et qui deviennent des épidémies nationales une fois les frontières verrouillées. Dans la plupart des pays, on en est encore au début de l’épidémie, et on voudrait savoir jusqu’où la courbe des infectés et des décès va grimper, et quelle est l’efficacité des mesures de confinement décidées dans la plupart des pays.

Fig. 1 : La propagation du Covid-19 en France, d’apres Le Monde en ligne

Les modèles mathématiques des épidémies permettent de répondre à ce type de question. Je voudrais expliquer ce qu’ils nous disent, sans pour autant m’aventurer dans des prévisions chiffrées précises, qui vont bien au delà de l’ambition de cet exposé, qui est d’introduire le lecteur ayant une culture mathématique à ce que sont capables de nous dire les modèles.

Le modèle de Reed-Frost

C’est un des plus vieux modèles mathématiques des épidémies. Il est très simpliste, mais il va nous permettre d’introduire des notions essentielles, et d’obtenir une formule mathématique importante. Les individus sont de trois types S comme susceptibles (d’être infectés), I comme infectieux (capable d’infecter un susceptible), R comme remis ou retiré (soit guéri, soit mort).
Voici ce modèle.

  • Temps discret (par exemple semaine par semaine)
  • n est la taille de la population (supposée grande)
  • Au début: n-1 individus de type S, 1 de type I, 0 de type R.
  • Un individu qui est infecté une semaine, infecte chaque susceptible avec la probabilité p la semaine suivante, puis guérit.
  • L’épidémie se poursuit tant qu’il y a des infectés, puis elle s’arrête.

Deux remarques : on a négligé la phase d’incubation, pour simplifier; on suppose qu’un individu de type R, s’il n’est pas mort (ce qui heureusement est le cas de l’immense majorité des R), est immunisé. C’est probablement vrai pour le Covid–19 si l’on s’intéresse aux 2 ou 3 mois à venir. Au delà, il semble qu’il y a perte d’immunité.

Le nombre de reproduction de base

Ce nombre, appelé R_0, est le nombre moyen de susceptibles qu’un infecté infecte au début de l’épidémie. Quand je dis « au début de l’épidémie », cela veut dire « lorsque presque toute la population est susceptible ».

Dans le modèle de Reed–Frost, combien vaut R_0 ? Donnons des valeurs à nos deux paramètres. Supposons que n=1 000, et que p=0,0025. Le premier infecté a autour de lui n-1\simeq n=1 000 individus susceptibles. Puisqu’il infecte chacun d’eux avec la probabilité p, ce nombre moyen vaut ici
\displaystyle R_0= n \times p =2,5\, .
Il est assez clair que si R_0<1, il n’y aura pas d’épidémie majeure avec un petit nombre d’infectés initiaux, de même si R_0=1. Par contre si R_0>1, un seul infecté initial peut déclencher une épidémie majeure, qui touche une fraction importante de la population.

La taille totale de l’épidémie

Une question importante, que se posent beaucoup de gens au vu de la croissance exponentielle du nombre d’individus touchés (cf. Figure 1), et qui nourrit les discussions entre épidémiologistes modélisateurs et responsables politiques, est : quelle fraction de la population totale sera touchée par l’épidémie ? Si l’on admet qu’une personne guérie est immunisée, il est clair que l’épidémie va s’arrêter tôt ou tard, au pire quand tout le monde aura été contaminé, et sera guéri et immunisé (un petit pourcentage étant mort). Mais dans la réalité, contrairement à la fable de La Fontaine, Les animaux malades de la peste, tout le monde n’est pas touché. Lorsqu’une fraction de la population est immunisée, dans le modèle de Reed–Frost, pour savoir combien de susceptibles un infecté infecte en moyenne, il faut multiplier p par le nombre de susceptibles, et bien avant que ce nombre ne s’annule, le produit p\times\text{\it nombre de susceptibles} passe en dessous de 1, et alors l’épidémie s’arrête.

Simulations du modèle de Reed-Frost

Voici ce que donnent 10 000 simulations du modèle de Reed–Frost, dans les cas R_0=0,8, R_0=0,95, R_0=1,5 et R_0=2,5.

Dans les deux premiers cas, R_0<1, et on voit qu’aucune épidémie majeure n’a lieu. La hauteur des barres de l’histogramme indique la proportion des infectés indiquée sur l’axe des abscisses.

Voici maintenant des simulations dans les cas R_0=1,5 et R_0=2,5. On remarque qu’une certaine fraction des simulations (qui ne dépend pas de la taille de la population) n’aboutissent pas à une épidémie majeure, tandis que la proportion d’individus infectés dans le cas d’une épidémie majeure se concentre quand la taille de la population augmente autour d’une certaine valeur, qui augmente avec R_0.

Fig. 3 : Simulations pour R_0=1,5. Haut gauche : n=500, Haut droite : n=1000, Bas gauche : n=2500, Bas droite : n=5000.

Fig. 4 : Simulations pour R_0=2,5. Haut gauche : n=500, Haut droite : n=1000, Bas gauche : n=2500, Bas droite : n=5000.

Une formule mathématique pour la fraction touchée par une épidémie majeure

Supposons donc que R_0>1. Dans la réalité, il n’y a pas un seul infecté initial, il y en a eu suffisamment dans chaque pays (au moins dans les pays développés), pour que l’épidémie majeure soit inévitable. Supposons que l’épidémie touche au total une fraction \tau de la population. Alors la fraction de la population qui n’est pas touchée par l’épidémie vaut 1-\tau, qui est aussi la probabilité qu’un individu choisi au hasard ne soit infecté par aucun des individus infectieux :
\displaystyle 1-\tau =(1-p)^{n\tau}=\left(1-\frac{R_0}{n}\right)^{n\tau} \simeq e^{-R_0\tau}.
pour n grand.
La première égalité résulte de ce que tous les individus dans la population ont la même probabilité d’être infectés, la seconde du fait que les « choix des victimes » par les divers infectés sont indépendants les uns des autres. La dernière inégalité approchée est une conséquence de l’énoncé mathématique suivant (1-a/n)^n\to e^{-a}, quand n\to\infty, ce qui signifie que plus n est grand, plus (1-a/n)^n est proche de e^{-a}. En fait la convergence ci–dessus est une loi des grands nombres. Comme on l’a vu ci–dessus, la proportion \tau est en fait aléatoire, mais elle tend vers une valeur donn\’ee quand n tend vers l’infini, comme la proportion de piles dans n jets de pile ou face successifs d’une pièce équilibrée tend vers 1/2.

Cette valeur \tau est donc la solution de l’équation
\displaystyle \tau = 1 - e^{-R_0 \tau}\, .
Il est assez facile de voir que \tau=0 est toujours solution de cette équation, que c’est la seule solution si R_0\le1, et que par contre si R_0>1, alors il y a une seconde solution 0<\tau<1. C’est cette seconde solution qui nous intéresse. Notons que cette valeur \tau dépend de R_0, et ne dépend que de R_0 ! On n’a pas de formule explicite de \tau en fonction de R_0, mais il est très facile de calculer sur ordinateur une valeur approchée de \tau pour chaque valeur donnée de R_0. Il y a un algorithme efficace et très simple à programmer. Si vous choisissez x_0=0,5, et posez pour n\geq1, x_n=1-e^{-R_0 x_{n-1}}, en quelques itérations vous trouvez une excellente approximation de la valeur cherchée. On trouve en particulier les valeurs suivantes :

R_01,522,533,544,55
\tau58%79%89%94%96,6%98%98,8%99%

et on peut tracer la courbe de \tau en fonction de R_0 :

Fig. 5 : La taille totale de l’épidémie en fonction de R_0.

Pour établir notre résultat, on est parti du modèle de Reed–Frost. En fait on peut l’établir dans un cadre plus général, mais avec quand même les trois hypothèses suivantes :

  • Pas d’immunité au départ (naturelle ou par vaccination). Vrai pour le Corona, pas pour la grippe saisonnière. Si la moitié de la population était immunisée, la taille totale serait très réduite !
  • Une communauté homogène. Pas vrai pour le Corona ni aucune maladie. Quelles hétérogénéités sont-elles à prendre en compte ? Cela dépend de chaque maladie et de son mode de transmission. On considère qu’il faut réduire le nombre d’infectés d’environ 10% à 20% par rapport aux prédictions du modèle homogène.
  • On a supposé que le comportement des individus ne change pas au cours de l’épidémie. Bien sûr les mesures prises par les autorités (fermeture des écoles et des lieux publics, confinement) changent la donne.

Ci–dessous : la taille totale de l’épidémie : en bleu dans notre modèle, en pointillé en prenant en compte l’hétérogénéité, et en jaune avec la moitié de la population initialement immunisée.

Fig. 6 : La taille totale de l’épidémie en fonction de R_0, selon : notre modèle, avec prise en compte de l’hétérogénéité, et si la moitié de la population est initialement immunisée.

Précisions sur le R_0 et comment le réduire

On peut factoriser R_0 ainsi:

\displaystyle R_0= p \times c \times \ell,

p est la probabilité de transmission à un « contact », c, le nombre de « contacts » par jour, et \ell la durée (nb de jours) de la période d’infection.

Les mesures de prévention visent à réduire R_0 en réduisant les paramètres suivants : p — masques, lavage des mains, … ; c — confinement, éviter les transports publics et les grands rassemblements,… ; \ell — diagnostic rapide, isolation des infectés, …

Si l’effet combiné de ces mesures réduit R_0 à R_E=a R_0, a<1, alors il n’y aura pas d’épidémie majeure si R_E\le 1, c’est-à-dire si a\leq 1/R_0 !

Conclusion : il faudrait des masques pour tout le monde (réduction de p) et tester massivement (réduction de \ell, comme le montre l’exemple de la Corée).

Vaccination

Si une proportion v de la population est vaccinée, alors R_0 est remplacé par R_v=(1-v)R_0 (chaque « tentative d’infecter » ne réussit qu’avec la probabilité 1-v), et :

\displaystyle R_v<1,\quad \mbox{ si }\quad v>1-1/R_0.

Deux conclusions sur la vaccination (malheureusement pas encore disponible pour le Covid–19) :

  • R_0 nous indique la fraction de la population qu’il faut vacciner, si l’on veut être sûr qu’il n’y aura pas d’épidémie majeure. Si R_0=2,5, il faut vacciner 60% de la population pour être sûr qu’il n’y aura pas d’épidémie majeure. C’est 75% si R_0=4 et 80% si R_0=5.
  • En se vaccinant, on se protège soi–même, et surtout on protège les autres.

Estimation de R_0

Observer la courbe d’incidence (cf. Figure 1) ne suffit pas.

Le taux de croissance r de la courbe dépend de deux facteurs : de R_0, et du « temps de génération » G (la durée entre le moment où l’on est infecté et celui où l’on infecte).

r croît avec R_0, décroît avec G. Il existe des formules qui relient r, R_0 et la loi de probabilité de G.

Par une méthode de « suivi des contacts » (le fameux « contact-tracing » en anglais), on peut obtenir des informations sur la loi de G, d’où, en combinant avec l’estimation de r, on peut estimer R_0 !

La dynamique de l’épidémie

Jusqu’ici on a surtout discuté la fraction de la population touchée par l’épidémie.
Pour décrire l’évolution de l’épidémie, dans le cas d’une grande population, et partant d’une situation où une fraction significative de la population est touchée, on va utiliser le modèle déterministe SIR qui suit. Désignons par s(t) (resp. i(t)) la fraction d’individus susceptibles (resp. infectés) à l’instant t. Le modèle s’écrit sous la forme d’un système d’équations différentielles :

\displaystyle \frac{ds}{dt}(t)=-\lambda s(t) i(t)
\displaystyle \frac{di}{dt}(t)=\lambda s(t) i(t)-\gamma i(t),

\lambda est la force d’infection, et \gamma l’inverse de la durée moyenne d’infection. Notons qu’au début de l’épidémie, s(t)\simeq1, et chaque infecté infecte au taux \lambda pendant une durée de moyenne 1/\gamma. Donc R_0=\lambda/\gamma. Le système d’équations différentielles ci–dessus est non linéaire. Si on fixe la condition initiale, ce système a une solution unique. On n’a pas de formule explicite pour la solution, mais pour chaque valeur numérique des paramètres \lambda et \gamma, on peut calculer une solution approchée sur ordinateur. On voit sur les quatre premières courbes que plus R_0 est grand, plus la vague des infectés arrive tôt et monte haut. En outre, la réduction de la hauteur du pic hauteurs du pic est plus marquée que la réduction de la taille totale de l’épidémie, lorsque l’on réduit $R_0$.

Fig. 7 : L’évolution du nombre d’infectés : en noir R_0=3, en bleu R_0=2,5, en rouge R_0=2, en vert R_0=1,5.

Si on part avec R_0=2,5, puis au bout de la troisième semaine (confinement) on réduit significativement R_E, l’effet de réduction de la vague est très important, même si R_E>1. Dans la réalité, on n’observe pas une modification si rapide de la courbe, à la fois parce que le confinement ne se met pas en place instantanément, et parce que notre modèle ne prend pas bien en compte des effets de retard inhérents à l’épidémie.

Fig. 8 : Evolution du nombre d’infectés : en noir R_0=2.5, après la 3ème semaine R_0=1,5 en bleu, R_0=1 en rouge, R_0=0,85 en vert.

L’épidémie actuelle du Covid–19

Concernant le Covid–19 en France, l’estimation de R_0 tourne autour de 2,5. Si le gouvernement n’avait pas pris de mesures fortes, 75 à 80% de la population aurait été touchée. Et surtout la vague serait arrivée très vite et serait montée très haut, submergeant le système de santé d’où plus de morts.

Ceci ne règle pas le problème de comment sortir du confinement. Une des difficultés est qu’à ce jour on n’a pas une bonne estimation du nombre de personnes en France qui ont été touchées par le virus. On sait combien ont eu des symptômes assez sérieux pour se rendre à l’hôpital, mais la particularité de cette maladie est qu’elle est bénigne et même indécelable dans beaucoup de cas. Et on ne connaît pas avec précision la proportion de ces cas. Donc on ne sait pas aujourd’hui quelle fraction de la population est immunisée, information qui serait importante pour décider de la stratégie de sortie du confinement.

Lorsque l’on disposera de suffisamment de tests sérologiques de détection des anticorps, on pourra tester un certain nombre de Français, pour savoir quelle proportion est immunisée.

Que se passera–t–il dans 2 mois, 3 mois, 6 mois ? Aurons–nous un retour à la normale relativement rapide, comme cela a l’air d’être le cas en Chine ? Au niveau Européen ? Au niveau de la planète ? Y aura–t–il des rebonds ? Chacun peut formuler des conjectures, mais je pense que personne, à ce stade, n’a de certitude.

Les épidémies et la recherche mathématique

Les épidémies constituent un champ d’application important des mathématiques. Bien sûr les événements que nous vivons attirent l’attention du public sur cette branche de la modélisation mathématique, et ils sont aussi l’occasion pour les spécialistes
d’accélérer leurs travaux, pour tenter de répondre à des questions qui vont conditionner la survie de milliers de gens.

Voici quelques uns des problèmes sur lesquels travaillent les mathématiciens et statisticiens qui s’intéressent aux modèles des épidémies.

  • Prise en compte de l’hétérogénéité de la population (foyers et lieux de travail, répartition spatiale, voyages, …) et analyse de ces effets.
  • Faut–il privilégier les modèles les plus réalistes, ou les plus simples (dont on peut mieux tirer des conclusions) ? Leurs réponses sont-elles très différentes ?
  • Quel est l’effet des diverses mesures préventives ?
  • Que peut–on estimer à partir des données disponibles, et quelles données supplémentaires seraient utiles ?

Cet article est une version complétée et remise à jour de la vidéo d’Etienne Pardoux, très largement inspirée par la vidéo en Anglais de Tom Britton de Stockholm :

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

Créez un site ou un blog sur WordPress.com

Retour en haut ↑

Créer un nouveau site sur WordPress.com
Commencer
%d blogueurs aiment cette page :