Intervention de Thibault Grouas

Mission commune d'information sur l'accès aux documents administratifs — Réunion du 20 mars 2014 : 1ère réunion
Audition autour du projet jocondelab de Mm. Jean-François Baldi délégué général adjoint de la délégation générale à la langue française et aux langues de france et thibault grouas chef de la mission langue et numérique Mme Claire Chastagnier adjointe au sous-directeur des collections du service des musées de france et Mm. Laurent Manoeuvre chef du bureau de la diffusion numérique des collections de la direction générale des patrimoines du ministère de la culture et vincent puig directeur exécutif de l'institut de recherche et d'innovation iri à la langue française et aux langues de france

Thibault Grouas, chef de la mission langue et numérique de la Délégation générale à la langue française et aux langues de France :

Avant JocondeLab existait un partenariat stratégique, SémanticPédia, entre le ministère de la culture, l'INRIA et Wikimédia France signé le 19 novembre 2012 pour favoriser l'échange des expertises et compétences pour réaliser des projets communs. Le premier projet financé par le ministère a consisté en l'extraction par DBpedia de ressources présentes sur Wikipédia, afin de constituer une nouvelle base de données, consultables en plusieurs langues. Le ministère a développé à cette fin un programme de sémantisation, dans le cadre du schéma directeur des systèmes d'information du ministère, qui vise à permettre l'alignement ou « liage » de bases de données entre elles. Voilà d'où est issu le projet JocondeLab qui, en partenariat avec l'Institut de recherche et d'innovation du Centre Pompidou, a associé trois directions du ministère de la culture, la délégation générale que nous représentons avec M. Baldi, le service des musées de France, la sous-direction des systèmes d'information... Ce n'était pas très courant ! En bref, JocondeLab aligne les données présentes sur Joconde avec les entrées de Wikipédia, dont le plurilinguisme est plus avancé, ce qui permet ensuite de consulter les données d'origine dans d'autres langues que le français. Nous ne nous en tenons pas à notre alphabet : le chinois et l'arabe sont déjà disponibles. Outre la langue française, quatre langues régionales de notre pays, le basque, l'occitan, le catalan, le breton, sont également présentes. Et ce, grâce à la richesse du fonds Wikipédia dans ces langues auquel il peut être accédé par des moteurs de recherche.

Aucun commentaire n'a encore été formulé sur cette intervention.

Inscription
ou
Connexion