Intervention de Ludovic Haye

Office parlementaire d'évaluation des choix scientifiques et technologiques — Réunion du 26 janvier 2023 à 9h35
Examen d'une note scientifique sur l'explosion des données numériques

Photo de Ludovic HayeLudovic Haye, sénateur, rapporteur :

Monsieur Bolo, une grande part des données est détenue par des entreprises privées du type Gafam, mais l'on ignore le volume global de données stockées sur les ordinateurs personnels de chacun. Une proportion importante des données échappe au décompte des données stockées même si des projections ont été réalisées pour tenter de l'évaluer.

Le volume de données dont il s'agit ici est moins celui des données créées que celui des données stockées dans les data centers, qui sont des données centralisées et « officielles », puisque chacun d'entre eux doit être capable d'indiquer combien de données il gère. Ce volume de données ne comprend pas seulement des données utiles et des données inutiles, mais aussi des jeux de données dupliqués. En effet, une même donnée est multipliée un certain nombre de fois, pour des raisons de sécurité ou de facilité. Parfois, plutôt que de sauvegarder uniquement un répertoire ou quelques dossiers, c'est l'ordinateur entier qui est sauvegardé, ce qui peut aboutir à de multiples « sauvegardes de sauvegardes ». Une sorte de fractale numérique s'opère alors. Ainsi, sur 3 téraoctets de données, seuls quelques gigaoctets peuvent être utiles en réalité. Je m'étais livré à un petit jeu avec un entrepreneur, en lui expliquant que stocker un gigaoctet de données coûtait environ 63 centimes d'euros. Ce montant paraît dérisoire pour une entreprise, mais multiplier par le nombre total de téraoctets ou de zettaoctets de données, cela peut aboutir à des sommes importantes, surtout qu'il m'a lui-même indiqué avoir trouvé douze fois le même jeu de données, qui avait donc été sauvegardé à douze endroits différents. Cette question des jeux de données est importante, d'autant qu'elle participe à la pollution numérique.

Pour répondre à Florence Lassarade, je voudrais dire que les données médicales sont un véritable sujet : les transferts de données existent depuis longtemps et certains cabinets de radiologie, qui gèrent des volumes de données médicales parmi les plus importants liés à l'envoi des clichés, nous avaient demandé, en tant qu'élus, de disposer de débits plus importants. On a alors pu s'interroger sur le caractère crypté ou non de ces transferts, même si de nombreux médecins possèdent encore des CD stockant des clichés, retrouvés parfois plusieurs années après dans les coffres des praticiens. La question des données médicales comporte des implications financières. En effet, si une donnée médicale se retrouve entre les mains d'un banquier ou d'un assureur, cela pourrait avoir une incidence sur l'obtention d'un prêt ou d'un contrat d'assurance. Les données médicales représentent, en outre, une avancée pour les déserts médicaux, en particulier les communes rurales qui n'ont plus du tout de médecins. Il existe d'ailleurs une belle adhésion de la population aux cabines de téléconsultation médicale. Si ces dernières tout comme la dermatologie font bien partie des situations dans lesquelles l'expérience du traitement des données est positive, comme pour tout ce qui relève de la prise de constantes, cela ne remplace pas la présence d'un médecin, surtout en cas de problème.

Aucun commentaire n'a encore été formulé sur cette intervention.

Inscription
ou
Connexion