Autre exemple : le nombre d'assujettis à l'ISF par commune. Les données figurant dans le tableau communiqué par Bercy est soumis à deux conditions cumulatives : y figurent seulement les communes de plus de 20 000 habitants qui comptent au moins 50 assujettis. Pour quelles raisons de tels seuils ? S'agit-il de préserver l'anonymat des assujettis ? Mais la Commission nationale de l'informatique et des libertés (Cnil) tolère déjà la publication de statistiques bien plus fines, dans d'autres cas, au-delà de 20 individus. En fait, la combinaison de ces deux critères empêche tout travail sérieux à l'échelle nationale, car nombre de communes de moins de 20 000 habitants comptent plus que 50 assujettis à l'ISF... Bercy et l'Equipement emploient beaucoup de statisticiens mais sont les administrations qui mettent le plus de barrières.
Des difficultés, ensuite, tiennent à la complexité même des données. C'est le cas avec les chiffres du chômage, où les décalages de chiffres entre le ministère - la direction de l'animation de la recherche, des études et des statistiques (Dares) - et Pôle emploi tiennent aux définitions même du chômage, ce qui pose d'ailleurs la question de la formation des journalistes. Le taux de chômage par commune, par exemple, n'a guère de signification, puisque nombre d'actifs n'habitent pas la commune où ils travaillent. Ce qui a du sens, c'est le taux de chômage par bassins d'emploi, mais cela n'empêche pas la presse de débattre du taux de chômage de telle ou telle commune...
Etalab est une très belle initiative. Pour informer correctement le public, il faut hiérarchiser les jeux de données et les mettre en scène. En l'état, il est très difficile de s'y retrouver parmi les très nombreux jeux de données disponibles. On le voit pour des villes comme Paris, avec son site Parisdata, qui fournit un nombre très important, trop important de données - jusqu'au nombre de chacune des espèces d'arbres... -, au risque de noyer les informations les plus significatives. Il est très difficile de s'y retrouver au milieu de toutes ces données.