De meilleures données, plus de vies sauvées

Auteurs):

Daniel Gilles

École d'informatique, Université de Guelph

Professeur agrégé et statisticien

Kurtis Sobkowich

Département de médecine des populations, Université de Guelph

Doctorant - Épidémiologie

Thérèse Bernardo

Département de médecine des populations, Université de Guelph

Chaire IDEXX sur les technologies émergentes et la santé préventive

Auteurs : Daniel Gillis, Kurtis Sobkowich, Theresa Bernardo

Le 11 mars 2020, l'Organisation mondiale de la santé a déclaré que l'épidémie de COVID-19 était une pandémie1. Les gouvernements du monde entier se sont efforcés d'élaborer des mesures pour prévenir sa propagation et pour identifier et soigner les personnes infectées. Au Canada, nous avons constaté un effort concerté de la part de tous les ordres de gouvernement pour travailler ensemble afin d'assurer la santé et la sécurité des Canadiens.

En temps de crise, la qualité et l'actualité des données utilisées pour éclairer les décisions peuvent faire la différence entre la vie et la mort, mais la disponibilité et l'accessibilité des données sont souvent limitées. La pandémie de COVID-19 a mis en lumière la nécessité d'améliorer les protocoles de collecte, de gestion et de partage des données au Canada.

En particulier, la pandémie a identifié des problèmes importants qui limitent notre capacité à réagir de manière appropriée et à tenir le grand public informé. Ces problèmes incluent des données incomplètes, inaccessibles ou incohérentes. Plusieurs de ces problèmes ont été exacerbés par les arriérés et les changements apportés à la façon dont les tests étaient effectués et évalués au Canada, mais même en gardant cela à l'esprit, il existe des possibilités d'amélioration.

Au début de la pandémie, les gouvernements provinciaux et fédéral ont fourni des mises à jour quotidiennes sur le nombre de cas canadiens confirmés de COVID-19, y compris le nombre de patients qui se sont rétablis ou sont décédés. Cependant, selon la source, on trouverait soit de nouveaux cas quotidiens, soit un résumé cumulatif. Les données ont été présentées sous forme agrégée, sans aucune information sur l'âge, le sexe, la race, le statut socio-économique ou d'autres variables généralement incluses dans les études épidémiologiques. Aucune information n'a été fournie sur le statut du cas (par exemple, asymptomatique, auto-quarantaine, soins intensifs, soins intensifs avec ventilateur, décédé).

Limites des données

Les limites des données ont conduit les chercheurs à parcourir les reportages des médias pour extraire des informations qui pourraient aider à encadrer notre compréhension de la maladie2. Des données sur l'âge et le sexe, ainsi que l'état de la maladie ont été extraites de ces histoires ; un processus long et susceptible d'erreurs. Au fur et à mesure que le nombre de cas confirmés augmentait, il est facile de voir comment ce processus est devenu insoluble.

Comme les rapports du monde entier ont fourni de nouvelles informations sur la maladie (par exemple, les sous-populations à haut risque), il est devenu clair que certaines données vitales pour freiner la propagation de la maladie et traiter les personnes infectées n'étaient pas collectées. Au moment de la rédaction de ce document, il y avait au moins une pétition demandant que le gouvernement de l'Ontario envisage d'ajouter des données raciales à la liste des données recueillies auprès des patients.3. Ne pas collecter ces données expose les communautés déjà marginalisées à un plus grand risque car nous ne pouvons pas savoir comment le virus les affecte, ni comment les soutenir au mieux.

Manque de données de contact et de recherche

Au-delà de ces besoins de données spécifiques, il y a un manque de données de contact et de recherche disponibles. Cela peut être dû à un manque de ressources pour collecter ces données, ou à des problèmes inconnus qui empêchent leur partage et/ou leur stockage centralisé. Ces données peuvent également ne pas être rendues publiques en raison de problèmes de confidentialité, mais les chercheurs sont habitués à travailler avec des données de cette nature. Les méthodes de traçage des contrats sans compromettre la confidentialité font l'objet de recherches actives.

Au fur et à mesure de la progression de la pandémie, le type et le format des données mises à disposition ont également changé. Utilisation de la machine Wayback4 nous savons que depuis le 20 mars, la page de Canada.ca consacrée au nouveau coronavirus5 des données sommaires énumérées par province et territoire ainsi qu'un rapport épidémiologique. Ce n'est que le 30 mars que certaines de ces données ont été mises à disposition pour téléchargement au format CSV. Pourtant, une grande partie des informations supplémentaires introduites restent incomplètes ou mises à jour de manière incohérente, donc non viables pour une analyse significative. Avant cela, ceux qui souhaitaient suivre la pandémie dépendaient de la transcription manuelle des chiffres, de l'utilisation d'outils de grattage de sites Web ou de l'utilisation de la Wayback Machine pour générer un ensemble de données complet. De même, l'Ontario a introduit https://covid-19.ontario.ca/ fin mars, mais avant cela, les données étaient d'abord présentées sous forme de résumés agrégés, puis sous forme de liste des nouveaux cas quotidiens sur Ontario.ca. Bien que ces données comprenaient des colonnes sur l'âge, le sexe, la source probable de transmission, l'état actuel et d'autres informations, beaucoup étaient répertoriées comme en attente.

Ces changements ont clairement été créés pour mieux servir les Canadiens. À l'avenir, le plan canadien de données sur la pandémie doit inclure des normes sur la façon dont les données doivent être présentées, y compris des conventions de dénomination spécifiques. Le Canada a élaboré un plan en tenant compte des données, mais il n'a pas été mis à jour depuis 20156. Il doit inclure des données faciles à trouver et accessibles dans des formats de fichiers courants (par exemple, CSV). Enfin, nous devons développer de meilleurs processus de partage de données entre les différents paliers de gouvernement afin que les données présentées soient cohérentes, complètes et opportunes; encore plus essentiel pour mesurer les progrès alors que nous nous éloignons progressivement du recours à la distanciation physique pour contrôler la pandémie.

Nous devons apprendre de la COVID-19 et améliorer notre plan canadien de données sur la pandémie afin de tirer pleinement parti de l'expertise scientifique de ce pays. Des vies canadiennes sont en danger.

Références:

1 https://www.who.int/dg/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19—11-march-2020
2 https://github.com/ishaberry/Covid19Canada
3 https://docs.google.com/forms/d/e/1FAIpQLScwcncSJBcoDpyEeiUnVNBBkB2SMVe_dj8fNPwltRF3T0XhFQ/closedform
4 https://archive.org/web/
5 https://www.canada.ca/en/public-health/services/diseases/2019-novel-coronavirus-infection.html?topic=tilelink
6 https://www.canada.ca/en/public-health/services/flu-influenza/canadian-pandemic-influenza-preparedness-planning-guidance-health-sector/surveillance-annex.html#a367