URL

https://www.medrxiv.org/content/10.1101/2020.10.14.20212621v2

Type d’article

Preprint

Thème

Phylogénétique
Phylodynamique

Que retenir de cet article, en 1-2 phrases ?

Étude phylogénétique et phylodynamique de la propagation du SARS-CoV-2 en Suisse basée sur des données de séquences (génome) échantillonnées entre février et août 2020. L’approche utilisée est assez générale/classique et pourrait être appliquée à d’autres jeux de données similaires.

Objectifs de l’étude / Questions abordées

L’objectif de cette étude est de caractériser l’évolution de la propagation du SARS-CoV-2 en Suisse à partir de données génomiques obtenues par un effort de séquençage intensif (3% - 7% des cas diagnostiqués par semaine dans le pays), combinées avec des séquences provenant d’autres pays. Les points abordés sont : l’évolution de la diversité génétique du virus en Suisse ; l’inférence des évènements d’introduction (temps et origine géographique) et la quantification de l’importance de ces évènements par rapport à la transmission locale ; l’estimation du R effectif et du degré de sous-échantillonnage au cours du temps.

Méthode

Données : séquences échantillonnées au cours du temps entre le 24 février et le 31 août 2020 dans toute la Suisse (3% -7% des cas hebdomadaires diagnostiqués), plus deux groupes de séquences étrangères sélectionnées suivant des critères de similarité génétique et/ou de mobilité vers la Suisse. Pour éviter le biais dû aux efforts de séquençage inégaux entre les différents pays, le nombre de séquences incluses par pays est choisi en fonction du nombre d’individus infectés et du nombre moyen de déplacements vers la Suisse depuis chacun de ces pays.

Les arbres phylogénétiques sont reconstruits par maximum de vraisemblance (IQ-TREE), les longueurs des branches sont estimées par moindres carrés (LSD). Les arbres sont enracinés en utilisant un “outgroup”. Des chaînes de transmission locale sont déterminées par des critères de similarité entre les séquences suisses dans la phylogénie, ce qui permet ensuite d’inférer les évènements d’introduction et de déterminer leur origine géographique par parcimonie. À partir des chaînes de transmission locale inférées, une analyse phylodynamique bayésienne est menée pour estimer le R effectif et le taux d’échantillonnage au cours du temps en Suisse. Le modèle de transmission utilisé est le BDSKY (birth-death-skyline-plot) avec une durée d’infectiosité moyenne fixée à 10 jours et les autres paramètres considérés constants par semaine et inférés avec BEAST2.

Résultats principaux

Cette étude permet de caractériser la diversité génétique du SARS-CoV-2 en Suisse au cours de la période étudiée, menant à la conclusion qu’il n’y a pas de preuve d’évolution à la fin de l’été 2020 vers une souche dominante moins virulente (ou moins pathogénique). En conséquence, les proportions relativement basses d’hospitalisations et de décès durant l’été seraient expliquées par un décalage de l’incidence vers les populations plus jeunes plutôt que par l’évolution du virus. Les auteurs quantifient l’importance des évènements d’introduction par rapport à la transmission locale au cours du temps et ils font le lien entre leurs résultats et les mesures de fermeture des frontières et de “contact tracing”. Les estimations du R effectif obtenues à partir des données génétiques sont cohérentes avec les estimations indépendantes obtenues à partir des cas confirmés.

Commentaire / brève évaluation, limites, ouvertures possibles

Il s’agit d’une analyse phylogénétique et phylodynamique des séquences du SARS-CoV-2 en Suisse assez classique qui permet d’arriver à un certain nombre de conclusions intéressantes sur l’évolution de l’épidémie dans ce pays, tout en présentant un cadre général qui peut être appliqué à d’autres pays / régions / jeux de données similaires.
Le choix des priors dans l’analyse phylodynamique est commenté, mais reste cryptique. Sur certaines périodes, les valeurs estimées du R effectif sont assez éloignées des valeurs estimées à partir des données d’incidence, quelques commentaires sur les possibles raisons de ces écarts auraient été bienvenus.
Comme les auteurs le suggèrent, ce serait pertinent de lier les données de séquences à des données épidémiologiques, de contact tracing, etc. afin de mieux comprendre la dynamique de l’épidémie en Suisse et ailleurs.