Je ne rappellerai pas le droit existant, chacun peut facilement consulter maintes sources à ce sujet ; je préfère formuler des recommandations. Les grands principes sont connus : on les trouve sur le site de la Cada. Notre modèle, ancien - la France a d'ailleurs été pionnière -, est inadapté à l'émergence de la société d'information. Protection des données personnelles, respect des droits des tiers détenteurs ou transparence et participation citoyenne, tout cela nous conduit à réinterroger notre modèle et notre cadre juridique. Il serait nécessaire de clarifier le droit applicable aux données publiques, de mieux définir les usages des données, de revoir la gouvernance publique.
La loi du 17 juillet 1978 ne concerne que les documents administratifs, y compris ceux émanant des opérateurs privés exerçant une mission de service public. Le droit français distingue le droit à l'information, souvent appelé droit d'accès ou droit de communication, du droit à la réutilisation, seul visé par la transposition de la directive du 26 juin 2013. Le droit à l'information se décompose en un droit général et un droit restreint - je vous renvoie à l'article 6 de la loi de 1978.
L'Union européenne a souhaité étendre ce droit en facilitant la réutilisation des données possédées par les musées, les bibliothèques et les archives et en limitant les freins à cette réutilisation, qu'il s'agisse des redevances, des droits d'exclusivité ou de recours en cas de refus d'accès.
La tentation serait, pour le Parlement, de se focaliser sur ce seul droit à la réutilisation. Or le droit de l'information, qui a une finalité fondamentalement démocratique, est le préalable du droit à la réutilisation. Leurs logiques sont certes différentes : l'information procède en effet du gouvernement ouvert, alors que la réutilisation procède de la logique des données ouvertes. Les données ouvertes ou open data ne sont qu'un des aspects du gouvernement ouvert. Le chantier est large : il concerne toutes les informations qui ont vocation à être mises en ligne. Est-il normal que toutes les collectivités territoriales ne publient pas leurs délibérations et leurs budgets sur Internet ? Certaines le font, mais dans des formats non standardisés, qui ne permettent pas une réutilisation facile. Autre difficulté : les droits d'auteur ; je pense par exemple aux conclusions des rapporteurs publics du Conseil d'Etat, qui permettent d'éclairer la décision mais ne sont pas diffusées.
Quelle réponse synthétique apporter à vos interrogations ? Les droits d'information et de réutilisation connaissent des exceptions parfois justifiées : la protection de la vie privée ou les intérêts nationaux, par exemple. En revanche, certains cas sont plus discutables : certaines administrations refusent de communiquer l'information malgré l'avis favorable de la Cada, d'autres font preuve de mauvaise volonté en transmettant des contenus dans des formats non standardisés.
Soulignons une autre difficulté : le producteur de la base de données a, en sus du droit d'auteur, un droit, qui lui est propre, d'empêcher l'extraction de sa base de données. Dans l'affaire qui a opposé Notrefamille.com au service d'archives départementales de la Vienne s'agissant des données d'état civil, le tribunal administratif de Poitiers a rendu une décision originale le 31 janvier 2013, en considérant le département comme un producteur de données ayant mis en oeuvre des moyens de production et des investissements.
Les difficultés devraient être levées avec la transformation de la loi de 1978 du fait de la transposition de la directive. Les services d'archives, les bibliothèques, les musées devraient être désormais couverts - mais pas les services publics industriels et commerciaux, dont les bases de données continueront d'être protégées.
Par ailleurs, la faiblesse des pouvoirs de la Cada explique la limitation de l'open data. Cela étant, les opérateurs non couverts par la loi de 1978 se réfèrent au droit de la propriété intellectuelle. Celui-ci protège non seulement les bases de données, les créateurs mais aussi les logiciels dès lors qu'ils sont uniques. Je souligne que l'administration a la possibilité d'acquérir les droits d'exploitation, mais non les droits moraux, distincts des droits patrimoniaux. Il en résulte que les auteurs peuvent toujours opposer un droit de divulgation ou un droit de repentir pour s'opposer à la réutilisation des données.
En revanche, les algorithmes ou les fonctionnalités d'un programme ne sont pas protégés par le droit d'auteur. La Cour de justice de l'Union européenne l'a confirmé en 2012, de même que la Cour de cassation dans un arrêt du 14 novembre 2013. Celle-ci a précisé que de tels outils conceptuels ne reflètent pas la personnalité de leur auteur et qu'ils n'expriment pas une originalité propre.
Depuis 2006 cependant, les agents publics bénéficient dans une certaine mesure d'un droit - encadré - de propriété intellectuelle sur leur production numérique. Cela peut limiter l'accès aux données, ces agents disposant d'un droit de divulgation et d'un droit de repentir ou de retrait. Pour faciliter la diffusion des oeuvres, le législateur a souhaité restreindre ces droits moraux à l'instar de ce qu'il a prévu en matière de logiciels. L'agent public dispose d'un droit de divulgation, mais dans le respect des règles auxquelles il est soumis dans le cadre de ses missions. De même, l'agent public ne peut s'opposer à la modification de son oeuvre par sa hiérarchie dès lors qu'elle ne représente pas une atteinte à son honneur ou sa réputation. Afin de prévenir tout conflit, le législateur pourrait prévoir que les données collectées par les agents publics relèvent en principe de leur mission de service public et que leur modifications sont réputées intervenir pour l'intérêt du service.
Qu'en est-il des oeuvres collaboratives associant agents publics et privés ? Au regard du droit existant, les jeux de données peuvent être rattachés à la notion d'oeuvre collective, ce qui donne un droit à l'administration sur l'ensemble de l'oeuvre.
Licences et clauses d'exclusivité peuvent limiter l'usage des données, vous l'avez noté. Les accords d'exclusivité sont encadrés car il s'agit d'un monopole d'exploitation, mais ils peuvent aussi se comprendre au regard de l'investissement nécessaire et important de la part du secteur privé. Par exemple, Google a décidé de numériser 15 millions d'ouvrages sur les 130 millions existants, il a passé un accord sur 400 000 ouvrages avec la Bibliothèque nationale australienne, un million d'ouvrages en Italie, respectivement pour 30 millions et 100 millions d'euros. En cela, il effectue une mission de service public, en contrepartie de quoi l'entreprise a un monopole d'exploitation.
La directive du 26 juin 2013 prévoit deux exceptions à l'interdiction de principe des clauses d'exclusivité : lorsqu'elle est nécessaire au fonctionnement d'un service d'intérêt général et pour la numérisation des ressources culturelles des administrations publiques. Elle recommande alors une durée d'exclusivité de dix ans, avec une clause de réexamen.
Pour finir, j'en viens à la gouvernance des données publiques. Elle doit évoluer, c'est une nécessité. Je propose trois axes. Distinguer le producteur du gestionnaire serait particulièrement innovant ; les administrations collecteraient les informations selon un référentiel commun, mais la définition des politiques d'open data resterait aux collectivités. En revanche, il faut un gestionnaire public des données. Erigé en établissement public et en gestionnaire unique, Etalab aurait une force de frappe considérable. L'intérêt serait de proposer davantage de services à partir d'un compte individualisé, notamment de nouveaux moyens de rémunérations pour les services complémentaires, et de créer une licence nationale pour les grands comptes - les entreprises multinationales qui consomment beaucoup de données nationales sans acquitter d'impôts en France. Ce ne serait pas une mesure de discrimination mais un droit d'utilisation.
Deuxième axe : les licences doivent être multiples, pour répondre à tous les besoins. Le share-alike est intéressant pour certaines entreprises, pour les collectivités. Pour d'autres, la clause de partage présente des inconvénients : elle met en place une viralité, puisque l'on est contraint de partager les données dans les mêmes conditions.
Enfin, un organe de contrôle renforcé pourrait prendre le relais de la Cada : j'imagine une commission nationale de l'information publique, qui saurait tirer les conséquences de l'évolution de la notion de document administratif vers celle d'information publique.
Je propose donc un aménagement plus vaste du droit existant que la stricte transposition de la directive. A la France d'affirmer son leadership tout en tenant compte de son modèle administratif multiséculaire face à un Royaume-Uni qui veut s'imposer comme le pionnier de l'open data.