L'Inserm est un établissement public à caractère scientifique et technologique dédié entièrement à la recherche sur la santé humaine, à l'expertise et à la veille scientifique, placé sous la double tutelle des ministères de la santé et de la recherche. Ses quelque 300 unités de recherche qui emploient environ 10 000 personnes sont implantées dans des hôpitaux, des universités, des centres de lutte contre le cancer. Dix instituts thématiques, créés début 2008, sont associés à l'Inserm afin d'animer la recherche dans leurs domaines respectifs et de définir une prospective.
En avril 2009, l'alliance nationale pour les sciences de la vie et de la santé (Aviesan), réunissant l'Inserm, le Centre national de la recherche scientifique (CNRS) et la conférence des présidents d'université (CPU) est venue renforcer la coordination nationale de la recherche. L'Inserm joue enfin un rôle déterminant dans la construction de l'espace européen de la recherche.
Nous utilisons des données très variées : sociodémographiques, cliniques, biologiques, génétiques, d'imagerie médicale, d'exposition à des facteurs de risques, des parcours de soin et de santé, des modes de vie. Les modes de recueil sont multiples. Parfois, les données les plus intéressantes sont collectées à des fins autres que la simple connaissance. Des modes de recueil spécifiques sont également mis en oeuvre par des enquêtes ad hoc, des registres, ou dans le cadre d'essais cliniques. Les données produites en routine - causes de décès, données de registre - peuvent être mises à notre disposition par conventions et réutilisées pour des usages épidémiologiques. Ainsi, les données du système national d'informations inter-régimes d'assurance maladie (Sniiram) et du programme médicalisé des systèmes d'information (PMSI) sont très intéressantes pour la recherche en santé, même s'ils ont été conçus aux fins de gestion et de financement des soins.
De manière générale, toutes ces données sont intéressantes dès lors qu'elles sont de qualité suffisante pour produire des résultats fiables et être utiles à la décision. L'Inserm a une très grande expérience de la production et de l'utilisation de ces données et une conscience de leur très grand degré de complexité et du niveau d'expertise nécessaire pour les traiter de manière à leur donner la valeur attendue.
La plupart des données collectées dans des enquêtes ne sont utilisées qu'à des fins de recherche, d'autres, produites en routine, sont utilisées à des fins de recherche dans le cadre de conventions de mise à disposition.
L'arrêté du 20 juin 2005 fixe la liste des organismes habilités à accéder aux données du Sniiram. L'Inserm en fait partie et bénéficie d'un accès « facilité », notamment à l'échantillon généraliste des bénéficiaires (EGB), à des extractions précises, mais l'accès à la base complète du Sniiram nous est impossible, ce qui interdit de procéder à de la fouille de données (data mining ou traitement de big data) ou à des recherches sans hypothèse a priori, et freine l'acquisition d'une expertise sur cette base et l'emploi pour des objectifs de recherche. Il est en outre difficile d'enrichir les données d'une enquête avec les données du Sniiram car l'utilisation du NIR (numéro d'inscription au répertoire national d'identification des personnes physiques, dit « numéro de sécurité sociale ») exige une autorisation par décret en Conseil d'Etat.
D'autres données intéressent les chercheurs : celles de l'INSEE notamment, couvertes par le secret statistique, ce qui nécessite des autorisations administratives et impose des délais non compatibles avec les exigences de compétitivité de la recherche. Les données recueillies par les médecins généralistes, les bases de données sociales, celles de la CNAM (caisse nationale d'assurance maladie des travailleurs salariés), avec lesquelles des appariements ont déjà été mis en place, celles concernant l'exposition environnementale ou l'alimentation nous seraient aussi très utiles. Un accès large et rapide aux données de santé est un enjeu majeur pour la compétitivité de notre recherche.
L'usage de données individuelles ré-identifiables est indispensable, en particulier dans le cadre du suivi de cohortes de patients, pour faire le lien entre les facteurs de risques et les cause de décès par exemple. Cloisonnement, cryptage et traçabilité sont donc indispensables. Cela exige, bien sûr, de s'assurer que ces données ne puissent pas être accessibles à d'autres fins que scientifiques. La loi « informatique et liberté » encadre leur usage. Les audits ou inspections ont montré que les chercheurs de l'Inserm font preuve d'un très grand professionnalisme dans les usages qu'ils font de ces données et sont extrêmement scrupuleux à cet égard. L'an dernier, la nécessité de faire évoluer le cadre juridique a été soulignée dans un avis de l'Aviesan : il faut faciliter l'accès aux données et leur usage, en particulier l'utilisation du NIR pour les activités de recherche. Il convient, comme le souhaitent également les sociétés savantes d'épidémiologie, que l'évolution de la réglementation européenne ne crée pas d'obstacles supplémentaires à l'utilisation de ces données.
L'Inserm n'a pas à proprement parler de politique d'offre de données ; cela étant, l'accès aux nombreuses bases de données créées à partir des initiatives des équipes de recherche fait l'objet d'arbitrages dans la plus grande transparence par les équipes et le conseil scientifique des études. En outre, l'ouverture des données, l'impact sociétal de la recherche et la collaboration avec d'autres équipes sont pris en compte dans le financement des appels à projets et l'évaluation des unités de recherche. Ces données font également l'objet de publications scientifiques à destination du grand public et les chercheurs doivent pouvoir y accéder.
La recherche publique doit bénéficier de règles spécifiques d'accès aux données de santé, afin de faciliter et d'accélérer leur exploitation. L'Inserm, qui joue déjà un rôle pivot pour l'accès à l'EGB, pourrait se positionner sur cet usage de données de santé pour la recherche : ses équipes présentent en effet des garanties d'indépendance, de déontologie et de compétence en la matière.
L'usage des bases de données exige une maîtrise sémantique, c'est-à-dire une bonne connaissance du sens des données qu'elles rassemblent et il doit être sécurisé au maximum en cas d'appariement et d'anonymisation : la centralisation est ici nécessaire. L'Inserm peut ainsi jouer un rôle de filtre pour l'usage des données car le service rendu au chercheur doit être indépendant du secteur privé, mais aussi de l'exécutif.
L'Aviesan a proposé d'établir une procédure institutionnelle claire, confiée à un opérateur unique, pour l'accès des chercheurs au Sniiram et à d'autres bases de données administratives et médico-administratives, avec des circuits et des modalités de procédure différents selon que la demande émane du secteur public ou du secteur privé, et qui permette de vérifier la pertinence des demandes d'accès au regard du contenu des bases. Est également recommandée la création d'une ou plusieurs plateformes techniques mutualisées, permettant l'extraction, le formatage, l'aide à la mise en forme et l'appariement des données extraites de ces bases, bénéficiant d'un financement spécifique garanti, distinct de celui qui est alloué aux organismes gestionnaires des bases. Ces plateformes seraient fondées sur un échange de savoir-faire entre ces organismes chargés de la gestion des bases et les équipes de recherche. L'Itmo de santé publique que je dirige est bien placé pour représenter la partie recherche dans le processus de constitution de cette interface.
Le Président de la République a récemment annoncé un grand programme de recherche sur la biologie des systèmes. Cette réflexion doit s'inscrire dans ce nouveau programme d'investissements d'avenir : c'est en effet la compétitivité de la recherche française qui est en jeu.
La base nationale de pharmacovigilance devrait être mieux exploitée, de même que la base de données sur les causes de décès en matière de surveillance sanitaire. Si elle avait été aussi bien renseignée et aussi rapidement en 2003 qu'aujourd'hui grâce à la certification électronique des décès, on aurait pu détecter beaucoup plus tôt la hausse de la mortalité due à la canicule. Faciliter l'accès à des données par les chercheurs, c'est encourager une approche plus interdisciplinaire en santé humaine, en recherche interventionnelle en santé des populations et dans le cadre du programme de biologie des systèmes. Les chercheurs forment le voeu qu'une part de leurs recherches puisse aider à des décisions plus éclairées, car fondées sur des faits documentés, en matière de politiques d'intervention en santé publique. Au-delà, il y a des interactions possibles entre les décideurs, les chercheurs, les gestionnaires des bases de données, les acteurs de soins et les acteurs de santé, grâce à la mise en commun des données de santé.