Intervention de Frédéric Van Roekeghem

Mission commune d'information sur l'accès aux documents administratifs — Réunion du 6 mars 2014 : 1ère réunion
Audition de Mm. M. Frédéric van roekeghem directeur de la caisse nationale d'assurance maladie des travailleurs salariés cnamts jean debeaupuis directeur général de la direction générale de l'offre de soins dgos housseyni holla directeur de l'agence technique de l'information sur l'hospitalisation atih et claude gissot directeur de la stratégie à la cnamts

Frédéric Van Roekeghem, directeur de la Caisse nationale d'assurance maladie des travailleurs salariés (CNAMTS) :

Le sujet des données de santé est complexe et très important tout à la fois, puisque l'assurance maladie détient des données sensibles portant sur l'ensemble de la population française. Cette question doit dès lors donner lieu à un débat approfondi pour en examiner tous les aspects et en mesurer tous les enjeux.

Le système national d'information inter-régimes de l'assurance maladie (Sniiram) a été créé par la loi de financement de la sécurité sociale pour 1999. Cette base de données nationale poursuit quatre grandes finalités définies par le code de la sécurité sociale : améliorer la qualité des soins, contribuer à une meilleure gestion de l'assurance maladie, contribuer à une meilleure gestion des politiques de santé et transmettre aux prestataires de soins des informations pertinentes relatives à leur activité et leurs recettes, et, s'il y a lieu, à leurs prescriptions. Il s'agit d'un entrepôt de données anonymes, collectées à partir des informations dont disposent les différentes caisses de remboursement de l'assurance maladie obligatoire. Il comprend les données relatives à toutes les prestations remboursées dispensées en médecine de ville et par les praticiens libéraux en établissements de soins, ainsi qu'à la consommation de soins en établissement. Il fait apparaître certaines caractéristiques anonymisées des patients tels que l'âge, le sexe, le bénéfice de certaines prestations sociales comme la couverture maladie universelle (CMU), la commune et de département de résidence, éventuellement le diagnostic d'affection et, depuis une date plus récente, la date de décès.

L'intérêt de cette base de données pour l'analyse du système de soins a été fortement augmenté depuis qu'a été mis en place en 2009 leur chaînage avec celles du PMSI - les mêmes algorithmes d'anonymisation étant utilisés par l'Atih et par la Cnam - et depuis qu'a été intégrée la date de décès à partir des données de l'Insee. Nous disposons ainsi d'une base extrêmement riche ; celle-ci a par exemple permis de réaliser deux études (dites Cnam 1 et Cnam 2) sur le risque de valvulopathie attaché à l'utilisation du Mediator, qui ont conduit aux décisions de retrait de l'ANSM.

Le Sniiram n'est pas une base de données fermée et inaccessible, contrairement à l'idée erronée que l'on voit parfois courir dans la presse. Il fait l'objet de trois ensembles de restitutions : 15 bases de données agrégées thématiques, un échantillon général de bénéficiaires (EGB) au centième de la population, et enfin la base de données individuelles elle-même qui retrace les données de consommation inter-régimes (DCIR). 71 types d'organismes ont aujourd'hui accès à certains de ces niveaux de restitution du Sniiram : 64 d'entre eux ont accès aux données agrégées et à l'EGB et 6 à la totalité du DCIR, moyennant certaines précautions exigées par la Cnil. Par ailleurs, depuis 2009, 35 extractions de données de cohorte ont été réalisées à des fins de recherche.

L'accès au Sniiram intégral est ouvert aux caisses d'assurance maladie, à la Caisse nationale de solidarité pour l'autonomie (CNSA), à l'Institut national de veille sanitaire (InVS - qui, compte tenu de ses missions particulières de prévention des épidémies, bénéficie de privilèges particuliers et a accès à des données indirectement réidentifiantes avec l'accord de la Cnil), à l'ANSM, à la Haute autorité de santé (HAS) et, depuis l'adoption d'une disposition législative et la prise d'un récent arrêté, aux agences régionales de santé (ARS). Les ministères en charge de la santé, de la sécurité sociale et des finances et les services déconcentrés y ont également accès, ainsi que le Haut conseil pour l'avenir de l'assurance maladie (HCAAM), l'Agence nationale de biomédecine, l'Institut national du cancer (Inca), l'Atih, l'Institut national de la santé et de la recherche médicale (Inserm), le Centre national de la recherche scientifique (CNRS), l'Institut de recherche et de documentation en économie de la santé (Irdes), le Centre technique d'appui et de formation des centres d'examen de santé (Cetaf), le Fonds CMU, l'Observatoire des drogues et des toxicomanies (OFDT), l'Institut des données de santé (IDS), l'Union nationale des organismes d'assurance maladie complémentaire (Unocam) et, plus récemment, ses fédérations constitutives, les fédérations hospitalières et leurs établissements membres (avec un accès plus limité pour ces derniers), le collectif interassociatif sur la santé (CISS) ainsi que ses associations adhérentes (avec de même un accès restreint pour ces dernières), l'Union nationale des professions de santé (UNPS), les syndicats de professionnels libéraux membres de l'UNPS, les unions régionales de professions de santé (URPS).

En pratique, un certain nombre de ces organismes n'accèdent cependant pas au Sniiram, notamment parce qu'ils ne disposent pas des structures qui leur permettraient d'exploiter ces données - ou qu'ils n'ont pas souhaité s'organiser pour ce faire. En 2013, ont ainsi été non actifs le HCAAM (pour lequel nous réalisons des extractions sur demande), le CNRS, le Fonds CMU, le Cetaf, l'Unocam, les fédérations hospitalières et leurs établissements membres (à l'exception du cas des données de cohortes de santé publique), le CISS et ses associations adhérentes, les URPS.

Le régime de l'accès aux données du Sniiram est strictement encadré. Il a d'abord été encadré par la loi de financement de la sécurité sociale (LFSS) pour 1999, qui a prévu que les accès sont définis par un protocole passé entre les régimes d'assurance maladie et approuvé par arrêté après avis de la Cnil. Le protocole historique datant des années 2000 a mis en place un comité de pilotage, dit Copiir, associant l'Etat (ce qui n'était pas initialement prévu par le législateur), les régimes d'assurance maladie et l'UNPS, et qui a pour rôle de proposer les évolutions qui doivent ensuite être fixées par arrêté.

On constate depuis 2002 un mouvement d'élargissement continu des organismes habilités à accéder au Sniiram. Le premier arrêté autorisant l'accès au Sniiram, en date du 11 avril 2002, a été largement complété par sept arrêtés successifs, le dernier en date étant celui qui a ouvert l'accès aux ARS. Une modification substantielle de l'accès aux données de santé est venue de la loi du 9 août 2004 avec la création de l'IDS, qui a été intégré au dispositif d'accès au Sniiram et au comité de pilotage par un arrêté du 20 juin 2005. Ont ainsi été prévus l'accès aux données du Sniiram pour les membres de l'IDS ainsi que la possibilité d'accéder à un datamart, à l'EGB ou à un traitement ad hoc pour des organismes à but non lucratif, pour une durée temporaire et sur le fondement d'un projet déterminé, après approbation de l'IDS et avis de la Cnil. Dans ce cadre, la Cnam réalise des extractions sous réserve de l'accord de la Cnil et dans le cadre d'une convention de cession de données.

Plusieurs principes président ainsi à la transmission de données du Sniiram. Sauf exception prévue par arrêté, les organismes à but lucratif n'ont pas accès à ces données. Les accès sont autorisés par la Cnil en tenant compte des risques de réidentification des personnes, notamment de façon indirecte à travers des croisements de données, ainsi que de l'adéquation des données transmises aux missions de l'organisme qui en fait la demande. Le principe de précaution est décliné à plusieurs niveaux : il est tenu compte à la fois du niveau d'agrégation et de l'échantillonnage des données, de leur périmètre (national ou régional, par exemple), ainsi que de la nature particulièrement sensible de certaines données définies comme telles par la Cnil lors de la mise en place du Sniiram. Il me semble que la définition des données sensibles devrait aujourd'hui évoluer pour tenir compte de l'enrichissement du Sniiram et des évolutions technologiques. Il existe une protection physique de haut niveau des données par un système d'identifiant et de mot de passe qui permet de garantir que seules les personnes habilitées y accèdent ; l'un des enjeux majeurs de la diffusion des données réside dans la possibilité de tracer et d'auditer les accès.

A côté du Sniiram, d'autres données concernant les professionnels et les établissements de santé sont mises à disposition par la Cnam sur son site internet. Le service ameli-direct fournit des informations sur l'adresse et les tarifs des professionnels ainsi que sur les indicateurs de qualité mesurés par la HAS s'agissant des établissements de soins. Ces données, non anonymes, sont considérées comme des données à caractère personnel au sens de la loi du 6 janvier 1978. Nous les diffusons au grand public au titre d'une autorisation spécifique ouverte par la loi du 9 août 2004 et codifiée à l'article L. 162-1-11 du code de la sécurité sociale, qui donne pour mission aux caisses d'assurance maladie de fournir « tous éléments d'information sur les tarifs d'honoraires habituellement demandés et toutes informations utiles à la bonne orientation du patient dans le système de soins ». Sont ainsi mis en ligne les tarifs des médecins, les tarifs dentaires, les horaires d'ouverture des cabinets, le nom des médecins exerçant dans un établissement de soins, le nombre d'actes pratiqués ou encore les durées moyennes de séjour.

Cette mise à disposition est bien entendu encadrée par la Cnil et toutes les données individuelles doivent faire l'objet d'une information préalable des professionnels concernés, qui disposent d'un droit de rectification. Nous ne sommes pas autorisés à transférer ces données individuelles à d'autres acteurs. La commission d'accès aux documents administratifs (Cada), qui s'est prononcée sur ce point à plusieurs reprises, a ainsi rejeté la demande de certaines sociétés privées qui souhaitaient obtenir communication de ces informations sous forme de bases de données, et l'un de ses avis de 2011 a été confirmé par le tribunal administratif de Paris. S'agissant des données relatives aux établissements de santé, la Cada s'est récemment prononcée sur le champ des données diffusables, qu'elle a limité au numéro d'immatriculation Finess ainsi qu'au numéro d'enregistrement RPPS. Ainsi, si de très nombreuses données sont disponibles dans le champ de la santé, nous devons respecter strictement les textes encadrant leur mise à disposition pour ne pas nous exposer à des sanctions pénales.

Il existe une autre contrainte relative aux données personnelles : l'article 12 de la loi du 17 juillet 1978 prévoit que la réutilisation des informations publiques est possible à la condition qu'elles ne soient pas altérées et que leur sens ne soit pas dénaturé. Dans un contentieux qui nous a opposé au site internet Fourmi Santé, il a été constaté que le simulateur de reste à charge utilisé ne distinguait pas entre les consultations de base d'un médecin et ses consultations spécialisées. Ce type de situation pourrait également engager notre responsabilité. Nous sommes par ailleurs astreints au respect des règles relatives à la propriété intellectuelle.

Nous avons mis en place à la fin de l'année 2011 une coopération avec l'ANSM afin de développer, en matière de médicament, un pôle d'expertise publique indépendant des laboratoires pharmaceutiques. En l'absence de publication du décret groupement d'intérêt public (GIP) compétent en la matière prévu par la loi « Médicament » de 2011, nous avons consolidé cette coopération par une convention qui fixe le cadre dans lequel nous réalisons des études à la demande de l'ANSM. Au titre de ce partenariat, nous avons notamment travaillé sur le risque thrombo-embolique associé aux pilules de troisième génération, sur la consommation des nouveaux anticoagulants ou, plus récemment, sur le Soriatane. Ces travaux ont donné lieu à des conférences de presse qui ont permis d'informer des risques associés aux différents produits concernés et de présenter, le cas échéant, des recommandations tendant à leur moindre utilisation. Nous avons également réalisé des études à caractère médico-économique. Cette coopération nous paraît très importante : il ne faut pas seulement se préoccuper de l'accès aux données, mais également s'assurer que celles-ci font l'objet d'un traitement pertinent, d'une interprétation correcte et que les études réalisées respectent une méthodologie adéquate. Il arrive en effet que des études effectuées par différents organismes aboutissent à des conclusions variables, notamment selon que ceux-ci sont ou non directement intéressés par le produit de santé concerné... Ainsi, une étude mise en ligne en septembre 2013, portant sur le risque thrombo-embolique associé à la contraception orale, et financée par les industriels concernés, a conclu qu'un risque statistiquement significatif ne pouvait être démontré pour les pilules de troisième génération, tandis que l'étude que nous avons réalisée montre le contraire.

Des extractions de données de cohortes sont demandées à travers l'IDS par des organismes publics dans le but de mener des études approfondies. L'INSERM, l'InVS, divers CHU comme ceux de Lyon, Toulouse, Rennes, Dijon, de La Réunion sont particulièrement demandeurs de ce type de données.

Quelles perspectives peut-on définir pour l'accès aux données de santé ? Il ne fait pas l'ombre d'un doute que le Sniiram, enrichi des données du PMSI et de l'INSEE, constitue une base de donnée très importante, qui présente un intérêt évident pour l'amélioration de la connaissance du système de soins et la conduite d'études de santé publique. Dans la mesure où cette base comporte cependant des données sensibles relatives à l'ensemble de la population française, la réflexion sur l'ouverture de ces données de santé doit prendre en compte les différents risques associés et identifier les moyens de les prévenir. Le premier de ces risques est celui de la réidentification, qui a changé de nature avec l'intégration dans la base des données du PMSI et de l'INSEE. La Cnil semble partager cet avis, puisqu'elle a demandé une étude spécifique sur les possibilités de réidentification. Dans le contexte nouveau du big data, il me paraît absolument nécessaire de reprendre la réflexion qui a eu lieu au début des années 2000 sur la nature des données sensibles et les risques liés aux croisements de données. Un deuxième risque concerne la possibilité d'intrusion dans les systèmes d'information. Nous sommes très vigilants sur ce point. Je me demande si nous ne sommes pas allés trop loin et si tous les organismes qui sont potentiellement autorisés à accéder aux données de santé disposent de systèmes d'information suffisamment sécurisés pour qu'ils puissent garantir que les dispositions de la loi Informatique et libertés sont pleinement respectées. Des réencadrements récents, qui ne touchent pas cependant aux données de santé, sont ainsi récemment intervenus dans le milieu hospitalier.

S'agissant des finalités de l'ouverture des données de santé, si les données dont nous disposons peuvent alimenter des études utiles à la santé publique, il est clair qu'elles peuvent également intéresser des initiatives de nature commerciale, à travers des études post-marketing ou visant à élaborer des garanties assurantielles segmentées. Nous pensons que les finalités de consultation et d'utilisation des données doivent être encadrées par la loi.

Les conditions d'utilisation des données constituent un sujet important dans la mesure où le choix d'une méthode statistique et le mode de traitement des données retenu peuvent exercer une influence significative sur le résultat d'une étude. C'est d'ailleurs la raison qui avait conduit à la création d'un GIP dédié par la loi de 2011 relative au médicament ; il avait été constaté que, dans de nombreux cas, la manière dont les données étaient traitées n'était pas conforme aux exigences scientifiques, et notamment que la neutralisation de certains effets d'échantillonnage pouvait conduire à des résultats très différents. En outre, comme je l'indiquais tout à l'heure, on note que les études financées par les promoteurs de produits ont tendance à leur être favorables. Enfin, la complexité des bases de données est telle qu'elle peut parfois conduire à des erreurs. Récemment, une étude fondée sur les données du Sniiram a ainsi conclu à un taux de recours aux neuroleptiques de 12 % dans une population, alors qu'il était en réalité de 20 % : les auteurs de l'étude avaient omis de prendre en compte les derniers médicaments génériques disponibles sur le marché. L'accès aux données et la compétence nécessaire à leur exploitation sont donc deux sujets qu'il convient de bien distinguer.

Dans ce contexte, l'expertise publique dans le domaine de la santé peut et doit être confortée, sous réserve que le secteur public s'organise de manière à prévenir les risques que j'ai évoqués. La décision d'ouvrir les données de santé à des entreprises à but lucratif est une question politique qui doit être pesée au regard des risques qu'elle pourrait engendrer. Enfin, il faut développer l'encadrement des organismes habilités afin de garantir l'application des lois de 1978, ce qui nécessite une grande professionnalisation de ces acteurs, notamment s'agissant de leurs systèmes d'information. S'agissant de l'évolution de la gouvernance des données de santé, des travaux sont en cours et il me semble que la question doit plutôt être posée au ministère des affaires sociales et de la santé.

Aucun commentaire n'a encore été formulé sur cette intervention.

Inscription
ou
Connexion