On peut déjà commencer par rappeler que la France n'a vraiment pas à rougir - en tout cas par rapport à nos principaux voisins - du nombre de jeux de données qui sont mis à disposition.
Parmi les sources de données, il y a Santé publique France, la Drees, mais aussi l'assurance maladie, qui publie ses propres données de vaccination depuis le printemps dernier. L'Institut national de la statistique et des études économiques (Insee) publie des données relatives à la mortalité. Ces différentes sources peuvent parfois donner l'impression d'une difficulté à travailler ensemble. Pour les données relatives à la vaccination, choisit-on Santé publique France ou la sécurité sociale ? Cela dépend de ce que l'on veut en faire. Il n'est pas facile de s'y retrouver.
Pour ce qui concerne le retraitement, je prends un exemple tout bête : si l'on fait un graphique sur le nombre de personnes qui se font vacciner chaque jour, en prenant pour point de départ le tout début de la pandémie, les premières doses seront à des niveaux beaucoup plus bas, mais, si l'on fait un zoom depuis l'automne dernier, on aura l'impression qu'elles sont toujours à un niveau élevé. L'information envoyée dépend donc de la façon dont on va mettre en forme les données, dont on va les représenter.
Quand nous travaillons sur un sujet, nous devons donc nous demander, par anticipation, ce que nous voulons montrer, avec quelles données et quelle est la mise en forme la plus adaptée pour atteindre le but recherché.
Pour ce qui est des difficultés d'accès, il est vrai qu'existe la tentation de vouloir toujours plus de données, mais nous avons parfois du mal à comprendre que des données publiées dans les rapports hebdomadaires de Santé publique France ne soient pas en open data, ce qui nous empêche de les exploiter. C'est toujours un peu rageant, même si l'on comprend qu'il y ait des contraintes techniques ou opérationnelles.
Je peux citer l'exemple des hospitalisations « pour et avec covid », c'est-à-dire des patients qui sont porteurs du SARS-CoV-2, que l'on appelle aussi les « patients covid ». On sait qu'une part d'entre eux est hospitalisée en priorité pour un motif autre que le covid. Cette information figurait dans les rapports hebdomadaires de Santé publique France il y a maintenant près d'un an, mais plus à l'automne. Nous voulions que cette donnée, qui nous semblait intéressante, soit ajoutée aux données qui sont mises à jour chaque soir. Nous sentions que le public était demandeur de cette information. Cette donnée a fini par arriver, il y a quelques jours, en open data. Nous en sommes très contents.
Guillaume Rozier a beaucoup parlé du changement de traçabilité : il pouvait effectivement être un peu frustrant et étonnant, alors qu'Omicron était en train de s'implanter en France, de ne plus pouvoir mesurer dans quelle région il progressait le plus. La situation est désormais rétablie, avec le nouveau système dont a parlé Guillaume, mais c'est vrai qu'il y a eu une période de flou au coeur des vacances de Noël.
Oui, il y a toujours des données que l'on regrette de ne pas avoir. Je peux en citer deux. Premièrement, la part, parmi les cas positifs, de symptomatiques et d'asymptomatiques, est une information qui me semblerait intéressante, surtout avec Omicron, alors que 300 000 cas positifs ont pu être recensés en 24 heures. Deuxièmement, il serait intéressant que nous puissions savoir combien de personnes, parmi les vaccinés qui n'ont pas encore reçu leur dose de rappel, ont été infectées il y a moins de trois mois et n'ont donc pas besoin de cette dose pour garder leur passe. Cette information serait précieuse, mais elle est impossible à avoir ; on ne peut que faire des estimations.