Concernant les retraitements, je suis très attaché à ce qu'il y ait une cohérence entre ce que l'on va calculer et publier de notre côté, en tant que citoyens, et les valeurs qui vont être affichées, par exemple sur le site officiel de Santé publique France. Si j'indique que le taux d'incidence actuel, en France, est de 2483, j'espère retrouver le même chiffre chez Guillaume Rozier ainsi que chez Santé publique France. Les données sont présentées de manière un peu différente, de façon à mettre en lumière certains aspects, mais les données nous affichons sont a priori les mêmes que celles des agences sanitaires.
Nous pouvons être amenés à effectuer quelques calculs, mais ces derniers sont tout à fait cohérents par rapport à ce qui est fait au niveau des agences sanitaires.
Il est effectivement important que nous puissions accéder aux données en open data. Les fichiers doivent pouvoir être facilement réutilisables par des programmes informatiques.
S'agissant des données que nous regrettons de ne pas avoir à notre disposition, je pense à la précision, notamment géographique, de certaines données. Nous avons souvent demandé à pouvoir descendre plus bas que le département, parce que les gens voulaient connaître le taux d'incidence dans leur commune, dans leur communauté de communes, etc. Des données infradépartementales sont fournies par Santé publique France, par tranche d'incidence - entre 0 et 100, entre 100 et 200... Au demeurant, cela pose des problèmes d'anonymisation des données : Santé publique France a cette contrainte de ne pas trop aller dans les détails, pour que l'on ne puisse pas identifier les personnes.
Nous demandons très régulièrement de nouvelles données. Nous sommes conscients que nous nous comportons là en enfants gâtés, puisque nous avons déjà énormément de données en France - notre pays est bien positionné au niveau international quant à la quantité d'indicateurs disponibles.
Concernant les données de l'éducation nationale, il faut savoir que nous n'avons eu les données, notamment les taux d'incidence par niveau scolaire, qu'à partir d'avril 2021. Précédemment, il y avait deux tranches d'âge - 0-9 ans et 10-19 ans -, ce qui était assez peu précis pour suivre l'épidémie au niveau des écoles. Depuis avril, les tranches d'âge sont beaucoup plus précises pour les taux d'incidence, mais un certain nombre d'informations ne sont malheureusement toujours pas disponibles. Cette situation est frustrante, parce qu'il s'agit de données que l'on peut retrouver dans des fichiers PDF diffusés çà et là, mais dont la reconstruction requiert un travail de fourmi.
L'information sur les réinfections nous intéresserait également. Elle existe d'ores et déjà. Actuellement, dans la base SI-DEP, qui contient les informations relatives aux contaminations, on considère qu'une personne est réinfectée si elle a deux tests positifs séparés de 60 jours. Quand plusieurs tests positifs sont réalisés au cours d'une même semaine, un seul est compté pour le taux d'incidence.
Il existe d'autres données : des données de séquençage, des données de séroprévalence, des données issues des études de cohortes. Ces données existent à différents endroits, mais ne sont pas facilement accessibles pour les personnes qui souhaitent les réutiliser.