URL
https://arxiv.org/abs/2004.04785
Type d’article
Preprint
Thème
Logistique (tests)
Que retenir de cet article, en 1-2 phrases ?
Cet article présente plusieurs algorithmes de tests groupés pour le dépistage de la COVID-19 et démontre, au travers d’exemples, leur efficacité pour réduire le nombre de tests nécessaires pour déterminer quelles personnes sont infectées et pour réaliser un test statistique sur la prévalence de l’infection (haute ou basse) dans un groupe donné . Les auteurs soulignent que ces stratégies de tests groupés sont d’autant plus économes qu’on observe un faible pourcentage de résultats positifs des tests PCR de détection de SARS-CoV-2.
Objectifs de l’étude / Questions abordées
L’objectif de l’article est de présenter différentes méthodes de tests groupés, de donner des stratégies adaptées à certaines problématiques et de les comparer au travers d’exemples. Les deux critères de performance étudiés sont le nombre de tests effectués et le temps total d’exécution. Deux problématiques sont étudiées : l’identification des individus infectés au sein d’un groupe et la réalisation de tests statistiques permettant de discriminer entre une valeur haute et une valeur basse de la probabilité d’infection dans un groupe donné.
Méthode
- Tests groupés pour déterminer les individus infectés au sein d’un groupe
Deux premiers algorithmes sont proposés pour identifier les résultats de chaque individu dans un groupe de quatre personnes en moins de quatre tests, dans le cas où au plus une personne est infectée. Le premier algorithme, dit non adaptatif, consiste à former trois sous-ensembles de deux individus, de regrouper leurs échantillons et de faire un test sur chaque regroupement. Le second algorithme présenté, dit adaptatif, consiste à choisir un premier regroupement de deux individus, puis de choisir à l’itération suivante ou bien le complémentaire de ce premier sous ensemble si le résultat est négatif, ou bien à tester un individu seul à l’intérieur de ce premier ensemble.
Deux autres algorithmes sont ensuite présentés pour déterminer les individus infectés dans un groupe contenant un nombre arbitraire de personnes infectées.
La stratégie sparsity-oblivious multi-stage (SOMS) consiste à former séquentiellement des regroupements, en commençant par le regroupement des quatre individus, puis en formant des regroupements deux par deux si nécessaire, et enfin de faire des tests individuels si nécessaire. A certaines étapes, plusieurs tests peuvent être menés en parallèle.
Dans la stratégie sparsity-oblivious fully-adaptive (SOFA), on utilise la connaissance que l’on a de la probabilité d’être infecté pour connaître l’espérance du nombre total d’infectés au sein du groupe complet. L’algorithme consiste alors à choisir récursivement entre soit faire un seul test sur toutes les personnes restantes dont le statut n’est pas encore identifié, soit scinder de façon binaire ce groupe et tester les deux sous-groupes séparément. Le choix entre ces deux stratégies est réalisé en comparant l’espérance du nombre total d’infectés avec le nombre d’individus infectés déjà identifiés jusqu’ici. Du fait des corrélations entre les sous-groupes déjà testés, on constate qu’il est plus avantageux de tester toutes les personnes restantes lorsque le nombre d’individus infectés déjà identifiés est grand par rapport à l’espérance du nombre total d’infectés. Afin de comparer les différents algorithmes, l’espérance du nombre de tests nécessaires rapportée au nombre d’individus est calculée pour plusieurs valeurs de la probabilité d’être infecté, en supposant que les individus deviennent infectés avec la même probabilité et indépendamment les uns des autres. Les auteurs soulignent également l’importance d’éventuelles corrélations entre l’état infectieux des différents individus du groupe.
- Tests groupés pour tester l’hypothèse de la prévalence des infections dans un voisinage
Des algorithmes de tests groupés sont proposés pour effectuer un test statistique d’hypothèse sur la prévalence des infections dans une sous-population. Les statuts d’infection de chaque individu sont modélisés par des variables de Bernoulli indépendantes identiquement distribuées avec un paramètre inconnu. L’hypothèse H0 (paramètre des lois de Bernoulli faible) est testée contre l’hypothèse H1 (paramètre élevée).
La population est divisée en plusieurs groupes de tailles égales, considérés comme infectés si au moins un individu est infecté à l’intérieur du groupe. Un test du rapport de vraisemblance permet de tester H0 contre H1, pour lequel une statistique exhaustive est donnée par le nombre total de groupes infectés: H0 est rejetée si le nombre de groupes infectés est supérieur à un certain seuil. Un premier test sur tous les échantillons ensemble est effectué, et, s’il est négatif, H0 est accepté, sinon une recherche par scindage binaire est faite, jusqu’à ce que l’on puisse conclure. Quelques extensions sont proposées pour améliorer les résultats, par exemple en prenant en compte la taille de l’échantillon pour déterminer si le premier test sur tous les échantillons regroupés a une probabilité assez grande d’être négatif pour qu’il soit intéressant à effectuer. Enfin, le taux non négligeable de faux négatifs qui a été démontré pour les tests PCR peut être intégré dans le modèle.
Afin d’évaluer l’efficacité de cette méthode, l’espérance du nombre de tests, le nombre de vrais et de faux positifs sont tracés en fonction du nombre total d’individus dans la population pour différentes configurations. De plus, des courbes ROC sont tracées en faisant varier la taille de la population, pour différentes tailles de sous-groupes et différents seuils de rejet.
Résultats principaux
- Tests groupés pour déterminer les individus infectés au sein d’une population
Dans le cas d’un groupe de quatre personnes dans lequel au plus une est infectée, l’algorithme adaptatif proposé peut permettre de déterminer les résultats individuels en moins de tests qu’avec l’algorithme non adaptatif. Cependant, dans le pire cas, le nombre de tests nécessaires est de trois dans les deux cas. De plus, l’algorithme adaptatif peut requérir un temps d’exécution plus long du fait de sa nature séquentielle.
Dans un groupe de quatre personnes dans lequel les infections sont indépendantes les unes des autres, les algorithmes SOMS et SOFA demandent en espérance un nombre de tests par individu significativement inférieur à 1, et d’autant plus faible que la probabilité d’être infecté est faible. L’algorithme SOFA requiert en espérance moins de tests que l’algorithme SOMS. Cependant, l’algorithme SOMS permet de mener des tests en parallèle à certaines étapes, réduisant en espérance le temps d’exécution. Dans un groupe de 8, 16 ou 32 individus, l’algorithme SOFA est également performant en termes de nombres de tests nécessaires. Enfin, dans un groupe de quatre personnes, les algorithmes SOMS et SOFA présentent également de bonnes performances en termes de nombre de tests dans le cas où les résultats des tests ont une structure de corrélation qui maximise l’espérance du nombre de tests nécessaires.
- Tests groupés pour tester l’hypothèse de la prévalence des infections dans un voisinage
Dans plusieurs configurations, la stratégie de tests groupés proposée donne de bonnes performances. Par exemple, dans une population de 4096 individus divisés en 128 groupes, avec un seuil de rejet de 26 groupes infectés, pour tester une probabilité d’infection de 0,005 contre 0,01, cette stratégie permet avec 83,9 tests en espérance, un taux de vrais positifs de 96 % associé à un taux de faux positifs de 3,5 %. En réduisant la sensibilité des tests PCR de 100 % à 80 %, on peut toujours obtenir un bon arbitrage vrais positifs / faux positifs (au moins 95 % et moins de 5 % respectivement). Enfin, il est montré que lorsque les probabilités d’infection sous H0 et sous H1 sont proches, la taille de la population doit être suffisamment grande pour conserver ce bon arbitrage.
Commentaire/brève évaluation
Cet article s’intéresse à la diminution du nombre de tests et du temps d’exécution des tests via l’application de stratégies de tests groupés. Cette problématique est particulièrement pertinente dans le contexte de pénurie de tests COVID-19 que plusieurs pays ont connu. De plus, l’article prend en considération les caractéristiques du virus actuel pour adapter les stratégies proposées et justifier leur pertinence. Notamment, ces stratégies fonctionnent d’autant mieux que la probabilité d’être testé positif est faible, ce qui est une caractéristique de l’épidémie actuelle.
Plusieurs stratégies concrètes sont présentées pour répondre à différents besoins comme la détection des personnes infectées dans un groupe ou la détection de clusters importants dans une population. Des exemples détaillés sont présentés et les résultats des différents algorithmes sont comparés. Ces résultats sont bien détaillés. Ils ne visent pas à être théoriques mais à être suffisamment généralisables pour être utilisés en pratique.
Il est dommage que l’article ne soit pas accompagné d’un code open-source proposant l’implémentation de toutes ces méthodes.