URL
https://doi.org/10.1101/2020.11.27.20239657
Type d’article
Preprint
Thème
Modèle
Que retenir de cet article, en 1-2 phrases ?
Habituellement, le nombre de cas secondaires est modélisé à l’aide d’une distribution binomiale négative. Les auteurs proposent l’utilisation de trois autres distributions pour quantifier l’hétérogénéité de la transmission et évaluent le biais possible lors de l’estimation lorsqu’on ne se place pas sous la distribution ayant généré les données.
Objectifs de l’étude / Questions abordées
L’article propose une modélisation de la distribution des infections secondaires, et ainsi du taux de reproduction “individuel”. Si cette distribution est connue (les auteurs la modélisent, et en estiment les paramètres à partir de données expérimentales), sa moyenne donne accès au taux de reproduction R_t, et l’étude de sa queue de distribution donne des informations sur le “superspreading”. Cela permet aux auteurs de quantifier la fraction de la population d’infectés responsable d’un pourcentage donné (par exemple 80%) des transmissions.
Méthode
Les auteurs proposent une distribution “Gamma généralisée Poisson” qui contient comme cas particuliers les lois :
- binomiale négative,
- Poisson-lognormale,
- Poisson-Weibull.
Ils étudient (formellement et numériquement) le biais et la variance des estimations résultant de la distribution lorsque la distribution générant les données est différente de celle utilisée pour l’inférence. C’est un travail de fond intéressant, et bien documenté dans l’article, qui est certes un peu technique, mais contient toute la bibliographe pour s’initier au sujet. Les auteurs appliquent leur approche aux données de Hong Kong, de l’Inde et du Rwanda (données en accès libre sur GitHub) pour quantifier la fraction de “super-contaminateurs”.
Résultats principaux
La distribution proposée par les auteurs, en particulier la loi Poisson-lognormale dans le cas des jeux de données réelles analysées, semble plus appropriée qu’une loi binomiale négative, généralement utilisée. Les auteurs ont accès à la fraction des infectés responsables d’un pourcentage donné de nouvelles infections. Les courbes obtenues permettent de quantifier le “superspreading”.
Commentaire / brève évaluation, limites, ouvertures possibles
L’article est novateur et propose une approche intéressante, bien qu’assez technique et formelle de l’étude de la distribution de contamination individu-centré.