Intervention de Henri Verdier

Commission des finances, du contrôle budgétaire et des comptes économiques de la nation — Réunion du 23 mai 2018 à 10h45
Utilisation et ouverture des données et des algorithmes en matière fiscale — Audition commune de Mm. Antoine Bozio directeur de l'institut des politiques publiques yannick girault directeur du service « cap numérique » à la direction générale des finances publiques dgfip jean lessi secrétaire général de la commission nationale de l'informatique et des libertés cnil et henri verdier directeur interministériel du numérique et du système d'information et de communication de l'état dinsic

Henri Verdier, directeur interministériel du numérique et du système d'information et de communication de l'État (Dinsic) :

Nous devons mesurer l'ampleur de la mutation que nous vivons. Antoine Bozio a rappelé tout à l'heure l'importance de la statistique publique pour connaître le réel et l'action publique. Étymologiquement, la statistique, c'est la science de l'homme de l'État. Aujourd'hui, parce que tout se numérise et parce tout s'exécute par l'informatique, chacun peut travailler directement sur les modèles et sur les outils autrefois réservés à une poignée de techniciens. C'est une révolution fondamentale.

Par ailleurs, vous nous avez demandé si l'on savait cartographier de manière exhaustive l'ensemble des données. Nous sommes en train de faire une copie digitale du monde, tout est mis en données, et probablement la production de données va plus vite que leur cartographie. L'action publique devra par conséquent être reconsidérée. Tout à l'heure, je parlais d'« État plateforme » : nous essayons de définir progressivement une politique cohérente de la donnée qui tienne compte de la protection des secrets légaux - pas seulement de la vie privée - de la nécessité d'ouverture, d'efficacité de l'État, de soutenabilité budgétaire, etc.

S'agissant des demandes d'ouverture des codes sources et des algorithmes, vous demandiez si quelqu'un en avait une vision centrale. Aujourd'hui, c'est le régime général de la loi Cada qui s'applique. Les requérants s'adressent d'abord aux administrations concernées et quand ils n'ont pas de réponse satisfaisante, ils se retournent vers la Cada. Celle-ci a donc une vision de ceux qui sont prêts à aller au contentieux, et non pas une vision exhaustive de l'ensemble des demandes d'ouverture.

En tant qu'administrateur général des données, animateur du réseau des administrateurs ministériels de données, nous nous employons à aider les administrations à ouvrir leurs codes quand elles nous le demandent, par exemple sur la taxe d'habitation et la taxe foncière. Or il n'est pas forcément facile d'ouvrir un algorithme et un code source. Vous pouvez consulter le blog de la mission Etalab, sur lequel nous avons documenté notre travail d'accompagnement à l'ouverture de l'ancien algorithme d'admission post-bac. Le système d'admission post-bac commence avec de grandes bases de données de type Oracle et se termine par des front office pour postuler dans telle ou telle université : il a fallu faire un patient travail de détourage pour dessiner le coeur qu'il fallait ouvrir, vérifier les secrets industriels éventuels.

Il faut aussi accompagner l'administration dans une culture de publication du code. Les gens du logiciel libre savent faire, ils connaissent les outils, ils savent documenter leurs codes. Ceux qui n'ont jamais travaillé ainsi, eux, sont un peu dépourvus. Ce travail d'éducation et d'accompagnement prendra quelques années.

S'agissant de la cartographie des données, une cartographie exhaustive serait une tâche sans fin puisqu'on génère des données dès qu'on ouvre un tableur Excel sur son poste de travail. Heureusement, il y a quand même un certain nombre de piliers. D'abord, la loi Cada oblige à la tenue d'un répertoire des informations publiques, nécessité rappelée par la loi pour une République numérique, qui fait obligation de les publier. Cette loi fait également obligation de publier par défaut, à partir d'octobre prochain, toutes les bases de données, présentant un intérêt social, environnemental, économique ou sanitaire.

Aucun commentaire n'a encore été formulé sur cette intervention.

Inscription
ou
Connexion