Je vous remercie de permettre à l'Insee d'intervenir sur ces sujets. L'Insee, depuis sa création, a vocation à mettre à la disposition du public les résultats de ses statistiques et de ses analyses. L'Insee est une direction du ministère de l'Economie et des finances. Il a été créé par une loi du 27 avril 1946 et un décret du 17 juin 1946 fixe ses missions : établir les statistiques relatives à l'Etat et au mouvement des personnes et des biens ; coordonner les méthodes, les moyens et les travaux statistiques des administrations publiques, centraliser leur documentation statistique et économique et réaliser l'unification des nomenclatures et des codes statistiques ; tenir à jour l'inventaire permanent de l'économie ; observer l'évolution de la situation économique ; entreprendre, à la demande du gouvernement et des administrations publiques, et, éventuellement, de personnes physiques ou morales de droit privé, des recherches et études sur les questions statistiques et économiques ; diffuser et publier les résultats de ses travaux ; favoriser le développement des sciences statistiques et les recherches économiques relevant de sa compétence ; réaliser, pour le compte des administrations publiques, des recensements approximatifs par voie de sondage. La loi relative à la démocratie de proximité a, en outre, chargé l'Insee de l'organisation du recensement de la population.
Ainsi la diffusion et la publication des résultats de nos travaux font partie intégrante de nos missions. Notre budget s'élève à 471 millions d'euros en crédits de paiement pour l'année 2014, dont 382 millions de dépenses de personnel. Les fonds de concours et attributions de crédits sont de l'ordre de 14 millions d'euros sur les 89 millions de dépenses hors titre II. L'Insee emploie 5707 équivalents temps plein (ETPT), dont 26 % sont des cadres A. Ces chiffres ne tiennent pas compte des services ministériels qui sont incorporés dans chaque programme ministériel. Ces services sont au nombre de 16 (bientôt 17 avec le service du ministère de l'intérieur) et comportent environ 2 000 agents. Cet ensemble constitue la statistique publique française.
En amont de l'élaboration de statistiques, l'Insee est chargé de tenir trois répertoires administratifs : le répertoire national d'identification des personnes physiques, qui permet à l'Insee d'attribuer à toutes les personnes concernées le numéro d'identification au répertoire ou numéro de sécurité sociale, le fichier électoral en vue du contrôle sur les listes électorales et le répertoire national des entreprises et de leurs établissements, le Sirene.
La loi du 7 juin 1951 fixe les modalités d'élaboration des statistiques. Une modification datant de 2008 a introduit la notion d'indépendance professionnelle dans la conception, la production et la diffusion des statistiques, et a créé une Autorité de la statistique publique qui veille à son respect et à l'application du code de bonnes pratiques européen.
Durant très longtemps, les enquêtes ont été la source quasi exclusive des résultats de l'Insee. En décembre 1986, une loi a introduit un article 7 bis dans la loi du 7 juin 1951 qui oblige les administrations et les personnes de droit privé gérant un service public à transmettre à l'Insee et aux services statistiques ministériels les données recueillies dans l'exercice de leurs missions, afin d'éviter une double collecte d'informations. Les fichiers administratifs ne sont pas la seule source d'informations. Par exemple, quasiment aucune des données de l'enquête « Trajectoires et origines», qui visait à évaluer l'impact des origines et d'autres facteurs dans les trajectoires de vie, ne provenait de fichiers administratifs. Il en va de même des données sur la conjoncture, collectées périodiquement auprès des chefs d'entreprises. En revanche, l'Insee utilise les déclarations fiscales afin d'éviter d'interroger les ménages ou les entreprises sur leurs revenus ou leur chiffre d'affaires.
Avant d'être mise en oeuvre, une enquête statistique doit suivre un processus de validation. Tout d'abord le Conseil national de l'information statistique (Cnis), qui regroupe les producteurs de statistique et leurs utilisateurs, et où Mme Evelyne Didier représente le Sénat, émet un avis d'opportunité, après avoir vérifié que l'enquête est utile, nécessaire et concerne une problématique importante du point de vue des utilisateurs. Une seconde étape est un avis de conformité à l'état de l'art donné par le Comité du label de la statistique publique. Il s'agit ici de valider les choix méthodologiques faits par le maître de l'ouvrage et de donner un avis sur l'obligation de réponse à l'enquête. Enfin, le ministre chargé de l'économie publie un arrêté qui liste l'ensemble des enquêtes statistiques d'une année donnée et indique celles qui sont obligatoires. L'avis du Comité du label a toujours été suivi à ce jour.
Le Cnis est aussi un lieu de concertation plus technique, notamment avec ses groupes de travail ad hoc. Ainsi, récemment, un groupe de travail sur l'évolution du questionnaire du recensement de la population, présidé par le sénateur Jean-Claude Frécon, a proposé des modifications du questionnaire du recensement que l'Insee mettra en oeuvre dans les années à venir.
L'Insee, dont l'une des missions est de diffuser largement les résultats de ses travaux, a mis en place un système de diffusion comportant plusieurs niveaux liés notamment à la confidentialité des données communiquées. Le premier niveau est un niveau « tout public» : la diffusion est faite gratuitement sur notre site Internet, principal vecteur de diffusion. Notre site offre des informations diffusées dans les meilleurs délais, comme les indicateurs de conjoncture, des études et analyses, des ouvrages de référence sur les grandes questions économiques et sociales, et des données détaillées qui offrent un accès à d'importantes masses de données, particulièrement pour un usage professionnel. Toutes ces informations respectent le secret statistique.
Cette palette diversifiée de produits en libre accès vise à répondre aux besoins des différents utilisateurs, particuliers, enseignants, étudiants, chercheurs, entreprises, médias, administrations. De nombreuses informations sont disponibles à un niveau géographique fin (régional, départemental, communal, voire infra-communal) et les directions régionales de l'Insee publient de nombreuses études à portée régionale ou locale, en partenariat avec des collectivités locales.
Les données diffusées sont toujours accompagnées de l'ensemble des métadonnées nécessaires à leur compréhension, les sources et la méthodologie employée. L'évolution de notre gamme de produits s'appuie aujourd'hui en grande partie sur l'écoute des attentes, grâce à des enquêtes de satisfaction. Ainsi, en 2013, les « Inseenautes » ont été interrogés sur leurs pratiques de lecture sur le web, sur la collection Insee résultats et sur les définitions des termes économiques. Huit Français sur dix ont une bonne opinion de l'Insee en 2013 ; cette proportion monte à neuf personnes sur dix parmi les utilisateurs du site Insee.fr. L'Insee réalise aussi, à la demande, des prestations payantes, tarifées au coût marginal, sur ses sources statistiques, qui requièrent des opérations de confection et de mise à disposition, dans le respect du secret statistique.
Au-delà des données en libre accès sur internet, il existe deux autres niveaux de diffusion. La loi du 7 juin 1951 punit la rupture du secret statistique de la même manière que la rupture du secret professionnel et interdit la communication des données confidentielles, qui permettent l'identification des unités statistiques. Elle prévoit toutefois des dérogations, selon des modalités précises. Un second niveau de diffusion est destiné principalement aux chercheurs et aux experts du privé : il leur fournit des données plus détaillées, individuelles, mais préserve toujours l'anonymat des personnes physiques. Il s'agit d'un partenariat avec le réseau Quetelet.
Le troisième niveau ne concerne que les chercheurs et donne accès à des données confidentielles, c'est-à-dire permettant l'identification des entreprises ou des personnes physiques, avec l'accord des Archives et après avis d'un Comité du secret statistique, présidé par un conseiller d'Etat, M. Jean Gaeremynck, et qui réunit les producteurs de données, des membres du CNIS et des chercheurs. L'accord du service producteur est en outre nécessaire. Cette procédure dérogatoire concerne environ 200 dossiers par an pour environ 800 chercheurs. Afin de garantir la sécurité des données, l'Insee ne fournit pas les noms des personnes physiques, sauf besoin explicité par les demandeurs, notamment en cas de tirages d'échantillons pour des enquêtes statistiques, et n'autorise l'accès qu'au travers du centre d'accès sécurisé du Groupe des écoles nationales d'économie et statistique (GENES), établissement public depuis 1971 mais très lié à l'Insee. Le chercheur travaille ainsi dans une bulle et ne peut rien en extraire qui ne respecte pas la confidentialité. En revanche, il peut consulter les données concernant les entreprises, depuis environ 30 ans, et, depuis 5 ans, celles concernant les personnes physiques.
L'ouverture des données, ou open data, est dans les gènes de l'Insee, puisqu'une de ses missions est justement de diffuser les informations qu'il produit. Notre site internet a reçu 30 millions de visites en 2013 ; la croissance est de l'ordre de 20 % par an sur les deux dernières années. Tous nos travaux statistiques ont vocation à y être largement diffusés sous différentes formes allant jusqu'aux bases de données détaillées. Ainsi l'Insee a récemment rendu publiques au deuxième semestre 2013 des bases de données à une maille géographique très fine, avec des « carreaux » de 200 mètres sur 200 mètres. Les mentions légales de notre site autorisent la réutilisation libre et gratuite de toutes les données statistiques qu'il contient, y compris à des fins commerciales, sans licence, ni versement de redevance, sous réserve de la mention de la source.
Nous attachons une attention particulière aux formats de nos données, pour faciliter leur réutilisation. Les formats traditionnels de type csv, xls ou de bases de données ont été enrichis récemment de formats avancés : nous publions en format RDF du web sémantique, les populations légales du recensement de la population, le code officiel géographique (COG) ainsi que les nomenclatures d'activité (code NAF) et de profession (dire codification PCS). Les modalités et algorithmes de traitement de certaines données, comme celles du recensement de la population, font l'objet d'une description détaillée en ligne. En outre, à titre plus exploratoire, l'Insee est partenaire du projet Datalift, de données sémantiques interconnectées sur ce que l'on appelle le web des données. Cette stratégie de long terme d'open data initiée en 2003 a conduit l'Insee à collaborer de manière étroite avec la mission Etalab lors de sa création, pour alimenter substantiellement en données la première version de data.gouv.fr, fin 2011, et définir des solutions techniques. Avec l'ouverture de la version 2 de data.gouv.fr fin 2013, nous avons fourni de nouvelles données dans le cadre du projet de loi sur la parité hommes-femmes.
L'Insee ne reçoit que très peu de demandes de communication de documents administratifs : deux seulement en 2013 : la première concernait le résultat du recensement de la population d'une commune consultable sur le site ! - et la seconde un bulletin d'état civil datant de 1945 que l'INSEE ne possédait plus. De manière générale, l'Insee ne constate pas de difficulté en la matière. En effet, si le document est couvert par le secret statistique ou par la protection de la vie privée, aucune communication n'est possible, hors la procédure dérogatoire décrite ci-dessus. Dans le cas contraire, l'Insee publie ce document sur le site internet ou le communique dès la demande.
Enfin, au titre des modifications institutionnelles et légales envisageables, je signale que nous souhaiterions récupérer les données de caisse de la grande distribution, pour améliorer le calcul de l'indice des prix et réduire le coût de collecte des données utiles. Une modification de la loi est nécessaire pour cela.