Mon domaine de compétence est plus particulièrement celui des questions de santé et c'est en recherchant des données à ce sujet que notre association s'est pour la première fois posée la question de l'accès aux données publiques.
Pour autant mon propos sera plus large, notre intérêt pour la mise à disposition des données publiques étant directement lié à l'exercice de nos missions. En effet, des données plus largement ouvertes faciliteraient l'information du consommateur, à travers nos différentes publications notamment, nous permettraient d'améliorer sa défense et même de créer de nouveaux services marchands ou non marchands.
C'est justement en voulant créer ces nouveaux services que nous avons rencontré des difficultés. C'est ainsi que souhaitant étudier la fracture sanitaire, l'UFC-Que Choisir a tenté d'établir une carte des implantations de cabinets médicaux corrélée au niveau des dépassements d'honoraires constatés. Il s'agissait pour nous, dans un but d'intérêt général, de créer un service gratuit à l'intention de tous les consommateurs pour leurs permettre de connaître l'offre médicale. Une telle information est en effet disponible sur le site de l'assurance maladie (Ameli-direct), mais elle n'est pas réutilisable : les consommateurs peuvent seulement interroger la base médecin par médecin.
Nous avons donc dû reconstituer la base par une procédure d'aspiration des données disponibles. Cette opération, effectuée par un prestataire, a coûté 20 000 euros, soit l'équivalent du budget annuel du pôle santé de l'association pour l'achat de prestations extérieures.
Nous avons rencontré le même type de difficultés lorsque notre association a souhaité établir une carte sur la qualité de l'eau potable. Le coût de la procédure d'aspiration des données s'est élevé à 8 000 euros.
La mise à disposition de ces informations sur notre site ne donne lieu à aucun retour sur investissement par la publicité. Elle représente un coût net pour notre association. Je souligne à cet égard que ce qui pour UFC-Que Choisir n'a été qu'un frein financier est susceptible de représenter pour d'autres acteurs une barrière infranchissable.
Plus généralement, les difficultés concrètes que nous rencontrons sont de plusieurs ordres.
En premier lieu, certaines données sont inaccessibles sous quelque forme que ce soit. La base de données existe mais elle est inaccessible. C'est ainsi que seule l'administration dispose d'informations sur la qualité de la prescription d'antibiotiques alors même qu'il serait intéressant de l'étudier dans un contexte d'antibio-résistance.
D'autres jeux de données ne sont pas directement mis à disposition. Les données brutes demeurent inaccessibles, seule est disponible une extraction faite à partir d'études particulières. Tel est le cas par exemple des données relatives à l'évolution du prix des services de téléphonie mobile, qui font l'objet d'études régulières de la part de l'Autorité de régulation des communications électroniques et des postes (Arcep). Faute de pouvoir confronter ces études avec les données brutes qui les fondent, il n'est pas possible de remettre en cause les choix méthodologiques (qui ne sont d'ailleurs pas forcément contestables) sur lesquelles elles prennent appui, ni d'analyser les données sous un autre éclairage.
Le troisième type de données mises à disposition est celui des données consultables mais non réutilisables, comme dans l'exemple précédemment évoqué de la carte des dépassements d'honoraires des médecins. Une start-up qui avait le même projet que nous mais à des fins marchandes a dû y renoncer au terme d'une action en justice.
La base de données relative aux relations entre l'industrie pharmaceutique, les médecins, les associations de patients obéira-t-elle à la même logique ? La France est en avance sur ce point puisqu'un site internet unique devrait être mis en place qui autorisera une consultation par les citoyens. Ces informations seront-elles cependant réutilisables facilement ? L'UFC-Que Choisir milite à travers le collectif Europe et médicament pour une réutilisation très large de ces données.
Le quatrième type de données utilisables est celui des données légalement consultables et réutilisables mais dans des conditions telles qu'il est presque impossible de s'en servir. Ainsi, lorsque l'on s'intéresse à la qualité du service de distribution d'électricité (fréquence des coupures, durée moyenne des coupures, investissements réalisés...), une seule donnée est mise à disposition par Electricité réseau distribution France (ERDF), celle de la durée moyenne des coupures par départements. Toutes les autres données détaillées sont certes publiques mais il revient aux communes ou aux agglomérations de les communiquer. Certaines procèdent à la mise en ligne de la totalité des données, d'autres de certaines d'entre elles seulement, et les dernières s'abstiennent de toute diffusion de ces informations. Or il impossible de relancer toutes les communes ou les agglomérations de France pour disposer d'un jeu complet de ces données.
Un autre exemple est fourni par l'étude de la qualité de l'eau (eau brute, eau potable) que nous avons engagée. Selon le cas, les informations disponibles relèvent du ministère de l'environnement (pour les eaux brutes, l'eau des fleuves notamment), du ministère de la santé (pour la qualité de l'eau potable) ou encore du ministère de l'agriculture. Cette répartition administrative ne facilite pas la tâche. En outre, si l'on s'attache plus particulièrement à la qualité de l'eau courante, on s'aperçoit que les bulletins de qualité de l'eau, qui résultent d'un seul captage, comportent des informations brutes difficilement compréhensibles sauf à être un spécialiste chevronné ; un effort de pédagogie serait nécessaire. En outre, le moteur de recherche mis en place par le ministère de la santé n'autorise pas la recherche par date alors qu'on compte parfois plus de 1 000 bulletins par an pour certaines zones. A nouveau, il est nécessaire d'aspirer les données, de les traiter et de les mettre en forme. D'une agence régionale de santé à l'autre, les pratiques de mise en ligne diffèrent, de même que la précision des données diffusées. Or il est peu pertinent de ne disposer que de relevés agrégés au niveau régional ou annuel : à ces échelles, il n'y a jamais de problèmes de qualité de l'eau. Ceux-ci apparaissent plutôt à l'échelle de la commune et à un moment donné.