L'allié non financé de la science ouverte : la gestion et le partage des données de recherche
Auteur:
Claire Brown
Caterina Strambio-De-Castillia
Judith Lacoste

Avertissement : La version française de ce texte a été traduite automatiquement et n'a pas été approuvée par l'auteur.
Le consensus est clair : les données de recherche financées par des fonds publics doivent être partagées. Partout dans le monde, les avantages du partage des données de recherche sont largement reconnus. Il favorise la transparence et la validation, réduit les efforts redondants, accélère la découverte, accroît l’équité et amplifie l’impact de la recherche grâce à la collaboration et à une utilisation efficace des ressources. En conséquence, les organismes de financement du monde entier imposent de plus en plus le partage des données. Cependant, ces mandats manquent généralement de financement pour les ressources substantielles nécessaires pour faire du partage des données une réalité.
Toutes les données ne sont pas égales : les défis uniques du partage de données d'images
Les données d’images peuvent provenir de divers types d’instruments et de technologies, tels que les microscopes optiques et électroniques et les imageurs précliniques et cliniques tels que les scanners IRM et CT. Cela rend les données d’images particulièrement complexes à gérer, mais la résolution du problème de gestion des données d’images donnera lieu à des solutions qui peuvent être appliquées à d’autres formats de données moins complexes. Les technologies avancées génèrent de grands ensembles de données multimodales et multiplexées, couvrant plusieurs cibles, sur différentes échelles spatio-temporelles. Ces ensembles de données proviennent de diverses sources, notamment la microscopie optique et électronique et l’imagerie médicale, chacune ayant des propriétés uniques. Gérer cette complexité sans normalisation mondiale est une tâche redoutable.
Le partage des données nécessite non seulement les images elles-mêmes, mais aussi des métadonnées complètes détaillant les expériences, les échantillons, les stratégies d'acquisition, les paramètres des instruments et les processus d'analyse. Pourtant, les chercheurs manquent : 1) des outils pour collecter et lier ces métadonnées aux images, 2) des ressources pour stocker les images en toute sécurité et 3) des référentiels publics disponibles et facilement accessibles pour l'archivage et le partage des données d'images.
Même lorsque les données sont disponibles, les chercheurs ont du mal à les trouver et à les réutiliser en raison d’un manque de connaissance des référentiels existants et d’outils de recherche inadéquats. Les chercheurs en IA, en particulier, qui s’appuient sur des données d’images annotées de haute qualité pour former et tester les modèles, ont du mal à trouver des données qui répondent à ces besoins. Sans normes communautaires, investissements dans la conservation et outils logiciels pour la collecte de métadonnées et la liaison aux images, le potentiel des données d’images scientifiques générées avec des fonds publics reste inexploité.
Le partage des données au Canada : une lacune critique en matière de soutien et d’infrastructure
Au Canada, le manque de financement pour les infrastructures de partage des données est criant. Les chercheurs sont tenus de se conformer aux politiques de partage des données, mais ils reçoivent peu de soutien pour l’éducation, la conservation, le stockage, la maintenance, le développement d’outils ou la diffusion des données. Les institutions individuelles doivent élaborer des plans de gestion des données génériques, une tâche souvent assumée par des agents de recherche surchargés de travail et dotés d’une expertise spécialisée limitée. Cette approche conduit à des efforts redondants, à des pratiques incohérentes et à des solutions fragmentées, ce qui entrave le partage efficace des données.
Plutôt que de se contenter d’efforts institutionnels isolés, le Canada a besoin d’une approche nationale unifiée qui mette en commun les ressources et l’expertise. Une stratégie coordonnée simplifierait les processus, minimiserait les redondances et permettrait une meilleure allocation des ressources pour relever les défis communs.
Tirer parti des réseaux pour des solutions collaboratives
Les réseaux existants, comme le Réseau canadien des plateformes scientifiques 1 (CNSP) et Global BioImaging 2 (GBI), démontrent la valeur de la collaboration interinstitutionnelle pour surmonter les défis communs. Des événements tels que la récente réunion Image Data Horizons GBI et la fondation de GIDE3 L'initiative montre que la collaboration transfrontalière peut favoriser le consensus et établir des approches rationalisées et efficaces du partage des données. La puissance d'une approche collaborative axée sur la communauté a été démontrée dans une collection Nature Methods de 2021 axée sur Rapports et reproductibilité en microscopie.
En suivant l’exemple de ces initiatives internationales, les institutions canadiennes, les plateformes d’imagerie et les laboratoires gouvernementaux peuvent mettre en commun leurs ressources et leur expertise pour créer une stratégie nationale de processus de partage de données normalisés et d’outils logiciels communs et robustes. Cette stratégie peut s’étendre au-delà de l’imagerie et servir de feuille de route permettant la création de référentiels de données nationaux, offrant aux chercheurs un endroit où placer des ensembles de données organisés qui peuvent être partagés pour maximiser l’impact de la recherche.
Appel à l’action : bâtir un écosystème de données de recherche collaborative au Canada
La recommandation de l'UNESCO sur la science ouverte appelle à une coopération internationale et multipartite pour réduire les écarts numériques, technologiques et de connaissances4L'UNESCO inclut la science ouverte comme résultat 4 dans son programme décennal récemment publié Plan stratégique pour la mise en œuvre de la Décennie internationale des sciences au service du développement durable5 Le Canada doit souligner que la science ouverte doit être utilisée de manière large et équitable pour démocratiser le progrès scientifique et l’accès aux connaissances scientifiques. Pour que le Canada respecte son engagement envers les objectifs de développement durable, y compris la science ouverte, il existe une occasion unique d’élaborer une stratégie globale de partage des données de bioimagerie. Il est essentiel que le Canada passe d’efforts institutionnels isolés à une stratégie nationale coordonnée. Les réseaux d’infrastructures comme le Réseau canadien des plateformes scientifiques jouent un rôle clé pour rassembler la communauté investie dans l’infrastructure de recherche qui génère des données d’imagerie. Pour répondre efficacement aux mandats de partage des données, le Canada doit investir dans l’infrastructure, l’éducation et le financement des ressources humaines dédiées à la recherche de consensus, à la normalisation, à la conservation, au développement d’outils et à la diffusion. La valeur des données de recherche partagées est indéniable. En s’appuyant sur les réseaux et l’expertise collective, le Canada peut établir une infrastructure nationale de partage des données qui accélère l’innovation, améliore la qualité de la recherche et maximise le rendement des investissements publics dans la science.
Il est temps d’agir maintenant : nos chercheurs, nos institutions et la communauté au sens large doivent s’unir pour faire de cette vision une réalité et positionner le Canada comme un chef de file mondial en matière de gestion des données de recherche.
Références:
1- https://cnsp-rcps.ca/
2- https://globalbioimaging.org/
3- https://founding-gide.eurobioiimaging.eu/
https://www.nature.com/collections/djiciihhjh
5- https://unesdoc.unesco.org/ark:/48223/pf0000383771
6- https://www.interacademies.org/sites/default/files/inline-files/Strategic%20Plan%20for%20the%20Implementation%20of%20the%20IDSSD%202024-08-25%2006_57_09.pdf