Intervention de Mohammed Adnène Trojette

Mission commune d'information sur l'accès aux documents administratifs — Réunion du 20 mars 2014 à 9h04
Audition de M. Mohammed Adnène trojette magistrat à la cour des comptes auteur d'un rapport sur l'ouverture des données publiques

Mohammed Adnène Trojette, magistrat à la Cour des comptes :

Je vous remercie de m'avoir invité à m'exprimer sur ce sujet sur lequel je me suis beaucoup investi car je l'estime crucial pour la santé de notre démocratie, la capacité de modernisation de notre administration, ainsi que pour certaines filières industrielles d'avenir. Ingénieur en informatique et télécoms de formation, ancien élève de l'ENA et aujourd'hui magistrat à la Cour des comptes, chargé de cours à Sciences Po sur l'Etat et la révolution numérique, j'ai à connaître de questions liées à l'informatique tant sous l'angle technique qu'à travers celui de la gestion publique depuis une dizaine d'années. Mes propos n'engagent nullement la juridiction à laquelle j'appartiens.

Conformément aux orientations fixées par lettre de mission, mon rapport traite exclusivement des cas où les informations publiques mises à disposition dans le cadre de la loi Cada sont commercialisées. Il est intervenu alors que le gouvernement, qui envisageait de donner un second souffle à l'ouverture des données publiques, s'interrogeait sur le sens des résistances opposées à ce mouvement par certaines administrations. Ce rapport apporte d'abord des clarifications factuelles et étayées sur plusieurs points : les raisons pour lesquelles les administrations ont fait le choix de mettre à disposition des données publiques de manière payante, alors que d'autres jeux de données sont accessibles gratuitement ; le montant des recettes tirées des redevances associées et les modèles économiques retenus par les administrations qui ont fait le choix de la commercialisation. Je me suis intéressé, en deuxième lieu, à l'impact sur la société de l'ouverture des données publiques, en m'appuyant notamment sur une comparaison internationale. J'ai enfin exploré les perspectives d'évolution des modèles de mise à disposition des données publiques.

Pour réaliser cette étude, j'ai envoyé un questionnaire sommaire à l'ensemble des administrations publiques productrices ou collectrices de données publiques avant d'auditionner chacune d'entre elles, et j'ai élaboré, pour chacun des services concernés, une fiche de synthèse validée par ce service. J'ai également fait parvenir un questionnaire à trente-six missions économiques françaises à l'étranger : sans doute serait-il intéressant que la direction générale du Trésor mette les réponses à votre disposition, voire les publie. J'ai enfin auditionné de nombreux experts et personnalités issus de l'administration française ou étrangère, de la société civile, de la sphère économique ou encore du monde universitaire.

J'ai tiré cinq grands enseignements de ces travaux. En premier lieu, les motivations avancées pour mettre en place des redevances de réutilisation de données publiques apparaissent parfois contestables. Ensuite, les recettes perçues en 2012 n'étaient pas de 100 millions d'euros et en hausse, comme certaines administrations ont pu le prétendre, mais de 35 millions d'euros - dont 4,5 millions acquittés par des acteurs publics -, en baisse d'un tiers par rapport à 2010. Le montant de ces recettes est concentré sur un très faible nombre d'acteurs, principalement l'Insee et l'IGN. Troisièmement, les modèles économiques retenus portent le plus souvent atteinte au principe de gratuité régulièrement réaffirmé par les autorités politiques et font fréquemment office de barrière à l'entrée pour les acteurs économiques, les citoyens et les associations. En quatrième lieu, tout porte à croire que l'ouverture des données publiques est source de bénéfices pour la société dans son ensemble, avec des effets directs et indirects qui pourraient s'élever à plusieurs milliards d'euros selon des estimations réalisées à l'étranger. Ces effets bénéfiques s'exercent à la fois sur le bien-être social, sur la création de valeur et d'emplois et sur les gisements de productivité grâce aux externalités générées. Enfin, la mise à disposition de données brutes doit être faite sur un modèle de plateforme qui attirera des utilisateurs innovants et favorisera l'apparition d'écosystèmes de réutilisation.

Quatre des motifs invoqués par les administrations pour mettre en place ou maintenir des redevances de réutilisation me paraissent fragiles. Le motif budgétaire a quasi-systématiquement été mis en avant, que la redevance soit présentée comme une « recette de poche », une « poire pour la soif » en période de contrainte budgétaire ou comme une ressource propre développée en contrepartie de la suppression ou de la diminution de subventions dans le cadre de la révision générale des politiques publiques (RGPP). Cette situation rend sensible, et non impossible, le passage à un modèle dans lequel les administrations ne percevraient plus de redevance. Ce motif est parfois accompagné d'un argument qui me paraît juridiquement fragile, et qui peut sonner comme une forme de chantage vis-à-vis des autorités budgétaires, selon lequel il faudrait renoncer à la production de données en cas de disparition de la redevance associée, dans la mesure où cette recette sert au moins à couvrir la collecte et la production des données. Or, la constitution de ces informations relève pour les établissements publics concernés de missions de service public statutairement définies et constitue une charge permanente et courante financée par autorisation budgétaire, conformément à la loi organique relative aux lois de finances (LOLF). Troisième motivation avancée par les administrations : la mise en place de redevances permettrait de réguler, c'est-à-dire de limiter, la demande de données - alors que, dans le même temps, l'Etat cherche à mettre en place une mise à disposition et une réutilisation massives de données ! Cette motivation me semble sinon choquante, du moins très contestable. D'autres acteurs conçoivent la redevance, de manière plus ou moins consciente, comme un moyen de protéger certains acteurs économiques en instaurant une barrière à l'entrée, c'est-à-dire en mettant en place une atteinte à la concurrence. Telle administration indique ainsi qu'elle souhaite « favoriser les gros clients » tandis que telle autre justifie l'inutilité d'élargir la base de ses clients par une baisse des prix par le fait que « les principales entreprises concernées sont déjà servies ». D'autres administrations évoquent un « consentement à payer » des acteurs établis... qui annoncent bien sûr un prix conforme à leurs intérêts, c'est-à-dire suffisamment bas pour assurer leur rentabilité et suffisamment élevé pour éviter que de nouveaux acteurs n'entrent sur le marché. Parfois captées par les intérêts de leurs clients, les administrations craignent alors que la suppression de leurs redevances ne déstabilise l'écosystème existant.

J'aimerais à présent revenir sur le modèle de plateforme, qui consiste à attirer à soi les profils créatifs afin de favoriser l'innovation. Ce concept, exposé dans l'ouvrage L'Âge de la multitude d'Henri Verdier et Nicolas Colin et repris dans le rapport de Nicolas Colin et Pierre Collin sur la fiscalité du numérique, fait écho à une réalité. Par exemple, en donnant gratuitement accès à sa bibliothèque Apple Store, l'entreprise Apple attire à elle des dizaines de milliers de développeurs d'applications souvent innovantes, qui totalisent des milliers d'années-travail, et récupère des données d'utilisation qui lui permettent d'identifier des usages ; en outre, elle perçoit 30 % des recettes issues des ventes. Ce concept de plateforme est très ancien : ainsi, les universités ont pour vocation de former des étudiants, mais elles fournissent également des services de base (de l'immobilier, du mobilier, la présence d'enseignants, une cafétéria, une bibliothèque...). Lorsque cela fonctionne bien, elles attirent à elles de bons étudiants et de bons enseignants. L'interaction au sein de l'écosystème universitaire favorise ainsi l'innovation et apporte un bénéfice à la collectivité. Pourquoi l'Etat ne fournirait-il pas semblablement une infrastructure informationnelle à disposition de tous et régie par le principe de gratuité, qui soit ainsi susceptible de profiter à la collectivité ? Il s'agit ainsi de récolter le produit des initiatives de la société civile et du tissu économique : c'est ce qu'on appelle, en économie, internaliser les externalités.

Il conviendrait de limiter la multiplication des licences locales, spécifiques à telle administration ou telle base de données, et de promouvoir les licences standards, interopérables et utilisables à l'international, à la fois pour favoriser la simplicité et la lisibilité de nos bases de données et pour augmenter leur attractivité. Je suis partisan des licences libres, qui permettent de diffuser des données brutes ou enrichies. Une clause de paternité des données pourrait éviter les attributions fallacieuses. Les clauses de share-alike supposent que la rediffusion de données même enrichies ou tronquées se fasse sans condition juridique supplémentaire par rapport à la mise à disposition initiale ; elles encouragent ainsi les démarches coopératives et collaboratives. Les gros projets - Linux, Wikipédia, OpenStreetMap - sont fondés sur ce modèle qui permet aux derniers maillons de la chaîne de se hisser sur les épaules des géants qui sont passés avant eux. On comprend que certains acteurs commerciaux soient effrayés ! La ville de Paris propose un modèle intéressant : l'accès gratuit aux données suppose l'acceptation de clauses de share-alike ; dans le cas contraire, l'accès devient payant.

L'ouverture des données publiques n'est pas exempte de risques ou de freins. Il ne faut pas oublier tout d'abord qu'une telle politique exige, en amont, une conception nouvelle des systèmes d'information et une réflexion lors de la conclusion de contrats de commande publique afin que les données ne soient pas appropriées par des acteurs privés. Le deuxième risque est celui d'une approche patrimoniale des données publiques et des redevances associées, qui résulte souvent d'une interprétation erronée du rapport Lévy-Jouyet sur le patrimoine immatériel de l'Etat. Cette perspective fait obstacle à une approche interministérielle et de long terme de la gestion des données publiques ; dans certains pays, des data officers y veillent, appliquant une vision transversale. Attention, d'ailleurs, à ne pas fournir des prétextes à l'inaction administrative. L'organisation de l'administration peut être propice à l'inertie ; et pour peu que celle-ci voie dans la redevance une recette de poche, le blocage n'est pas loin. La protection de la vie privée est souvent brandie comme un chiffon rouge, prétexte à ne pas progresser dans l'ouverture des données. Sur le sujet du big data, ensuite, il ne faut céder ni à la naïveté ni à la paranoïa. Son périmètre doit être bien distingué de celui de l'open data : la politique d'ouverture des données publiques n'a pas vocation à mettre en danger la vie privée des citoyens. Les données personnelles aujourd'hui les plus utilisées sont d'ailleurs celles mises en ligne par les utilisateurs eux-mêmes. Vous saurez plus vite si j'ai la grippe en consultant ma page Facebook qu'en fouillant la base de données de remboursement de la caisse nationale d'assurance maladie (Cnam). Quatrième risque : la préférence des acteurs pour le court terme. En 2010, l'IGN a ainsi perçu quelques millions d'euros pour la vente de ses bases cartographiques aux géants du Web. On s'est cependant rendu compte quelques années plus tard qu'il s'agissait d'une opération unique : les acteurs privés, qui font travailler gratuitement les utilisateurs en leur offrant par exemple des sacs à dos équipés de caméras, ont désormais les moyens de se passer des données de l'IGN. En outre, cette barrière à l'accès aux données a empêché de nombreux utilisateurs potentiels de développer des services alternatifs. Au total, le bénéfice de cette vente a été très inférieur à la valeur potentielle actualisée de la base de données de l'IGN. Face à ce risque, la plateforme est une stratégie intelligente et qui permet de conserver la souveraineté sur les données publiques ; l'IGN y travaille actuellement. Le dernier risque est celui d'une approche défensive et protectionniste. Le niveau élevé de certaines redevances s'explique par la peur de la captation de la valeur par de grands groupes privés qui échappent à l'impôt en France ou en Europe. Mais comment penser sérieusement qu'une redevance de 15 millions d'euros puisse arrêter des groupes tels que Google, Facebook ou Amazon ? Attention à ne pas différer des choix importants sous l'effet d'un complexe de citadelle assiégée.

A la suite de mon rapport, le Gouvernement a pris plusieurs mesures : il a supprimé certaines redevances, a clarifié sa doctrine sur ce point en précisant qu'elles ont toutes vocation à disparaître, et a confié au secrétariat général pour la modernisation de l'action publique une mission d'accompagnement de plusieurs opérateurs dans leur transition vers de nouveaux modèles économiques.

J'en viens aux questions que vous m'avez adressées. Vous m'interrogez sur les éléments de calcul des bénéfices susceptibles de résulter pour les différentes catégories d'acteurs de l'ouverture des données publiques. Celle-ci présente tout d'abord un intérêt non marchand non négligeable pour la démocratie et la modernisation des administrations. D'un point de vue économique, les références scientifiques permettant de chiffrer l'impact de l'ouverture des données sur la société sont rares. Des modèles empiriques existent néanmoins, qui font état d'une évolution en trois phases, au terme de laquelle les données sont sources de revenus. La première, où l'on renonce à la redevance et où l'on investit (on sème), est une phase coûteuse et déficitaire pour la collectivité publique. Puis vient la phase de germination, les premiers gains de productivité apparaissent, une activité économique se développe. Enfin vient la récolte, sous forme de bénéfices sociaux et économiques, donc fiscaux. Voyez l'expérience danoise, ou le cas du secteur de la météo aux Etats-Unis après l'ouverture des données publiques. Une étude finlandaise conclut que le chiffre d'affaires du secteur de l'information géographique croît davantage (de l'ordre de 15 % supplémentaires) dans les pays qui ouvrent cette information gratuitement ; les travaux de l'IGN semblent corroborer ce constat, puisque l'ouverture de ses données aux organismes chargés d'une mission de service public a conduit à la multiplication par vingt des volumes de leur téléchargement. Au Royaume-Uni, l'ouverture des données publiques en 2010-2011 a engendré un profit estimé à plus de 8 milliards d'euros, dont 2 en bénéfices directs.

Vous m'interrogez également sur l'ampleur et l'intérêt pour les différentes catégories d'utilisateurs des gisements de données publiques non encore ouvertes. Le propre de ces données est l'incertitude des effets qui résulteraient de leur ouverture ; pour autant, il est possible d'anticiper l'impact de l'utilisation de certains types de données. S'agissant des données de santé, les informations relatives à la prescription des statines en Angleterre, qui étaient remboursées à hauteur de 450 millions d'euros par an, montrent qu'une économie de près de 230 millions d'euros aurait pu être réalisée si un générique avait été systématiquement prescrit. L'exploitation de ce type de données, qui laissent entrevoir des possibilités d'économies considérables, peut constituer un instrument très précieux d'aide à la décision publique. Il faut par ailleurs avoir à l'esprit que le monopole de fait ou de droit dont disposait l'Etat sur la collecte ou la production des données constituant des référentiels, comme les registres d'entreprises, les données géographiques ou les informations figurant dans les bulletins officiels (pour l'achat public notamment) est aujourd'hui remis en cause. Dans ce contexte, plutôt que sur les gains de l'ouverture, il faut s'interroger sur les pertes certaines que font courir le maintien des barrières et l'absence d'une réutilisation massive : perte d'un lien avec les citoyens, de valeur économique et de souveraineté dès lors que les utilisateurs se tournent vers des bases de données privées. OpenStreetMap, souvent plus performant que les services de Google, Microsoft et Apple dans les zones denses, est de plus en plus utilisé par les services publics de sécurité, notamment les pompiers et le Samu. Idem pour le projet collaboratif Open Meteo Foundation ; il est aujourd'hui préféré par les acteurs publics. Il a été imaginé par un petit génie français de 22 ans dans sa chambre, chez ses parents...

Avant d'étudier les coûts de la mise à disposition, il faut se poser la question de l'utilité d'une redevance pour service rendu. Est-il même souhaitable de mettre en place une redevance sur des données brutes élaborées dans le cadre d'une mission de service public ? À cette question, le Gouvernement a clairement répondu non. Il me semble que l'analyse par les coûts n'est pas pertinente. D'abord, parce que les coûts associés à une mission de service public ne peuvent être financés que par l'autorisation budgétaire. Ensuite, parce que la comptabilité analytique n'est pas toujours efficace pour calculer ces coûts. En troisième lieu, le respect de l'article 15 de la loi Cada est difficile à contrôler. Enfin, dans le secteur du numérique, un tarif défini a priori, fondé par exemple sur le consentement à payer, est nécessairement hasardeux dans la mesure où tous les utilisateurs potentiels ne sont pas connus. Toutes les entreprises du web, dans leur phase d'expérimentation, appliquent la gratuité pour identifier les vrais usages et en déduire ensuite la tarification appropriée.

Il me semble que l'article 15 de la loi Cada, et notamment ses premier et troisième alinéa, crée une confusion quant au concept de gratuité de la réutilisation des données publiques et entretient une ambiguïté autour des motifs qui peuvent justifier la mise en place d'une redevance, sans compter que la vérification des plafonds de recettes est très complexe. Il me semble en revanche intéressant qu'une tarification puisse reposer sur des services ou des droits supplémentaires dits premium - à condition qu'une telle tarification ne s'oppose pas à la possibilité d'accéder gratuitement à l'ensemble d'une base de données brutes, qui constitue un bien public informationnel. Ces services supplémentaires peuvent recouvrir un débit accru, un accès anticipé aux ressources, un accès à des traitements supplémentaires, la mise à disposition d'espaces de stockage volumineux, la fréquence de mise à jour de la base de données ou encore la mise en place de hotlines. En ce qui concerne les droits supplémentaires, on peut penser à un droit de réutilisation dans le cadre de licences très permissives. J'y insiste, il faut ouvrir l'accès aux données brutes, notamment pour les jeunes pousses, les entreprises innovantes. Tout modèle qui limite leur accès, en privilégiant les gros volumes ou l'activité commerciale de l'acquéreur, est dangereux.

Les financements coopératifs peuvent être particulièrement adaptés pour des opérations ponctuelles de financement de services complémentaires détachables d'une mission de service public. Je pense par exemple à l'ouverture de stocks de données qui ne sont plus alimentés et qu'il est nécessaire de remettre en forme. Ces modes de financement, qui n'engagent à rien, ont le mérite d'éviter les barrières à l'entrée et les clauses d'exclusivité dans le temps. La plateforme MyMajorCompany a rencontré un grand succès dans le domaine culturel.

En conclusion, plutôt que de considérer les bases de données publiques comme des ressources naturelles épuisables, reprenons l'analogie du grain de blé qui est semé et récolté ou encore celle de la bougie de Thomas Jefferson qui peut servir pour en allumer d'autres sans perdre elle-même en luminosité...

Aucun commentaire n'a encore été formulé sur cette intervention.

Inscription
ou
Connexion