Données et environnement : comment prévenir les marées noires du XXIe siècle ?
Rédigé par Régis Chatellier
-
19 May 2021Alors qu’elle pose pour principe la minimisation des données, et une certaine frugalité, la protection des données pourrait-elle participer de la protection de l’environnement ? Un sujet plus complexe que cette première comparaison, que le LINC souhaite creuser.
« Les données sont le pétrole du 21ème siècle », l’or noir des entrepreneurs et le carburant de l’économie. Cet adage, devenu mantra dans les années 2010, aura fait couler des litres d’encre noire. Pourtant l’expression en elle-même n’a pas réellement de sens, voire traduit une certaine mécompréhension de ce que sont les données et de ce qu’est le pétrole.
Un pétrole pas si fossile
Les données peuvent effectivement se transformer en carburant de l’économie, sources de convoitises qui nécessitent qu’on en régule l’appétit : par le RGPD pour les données personnelles, mais également par toute une série de textes en cours de négociation au sein de l’Union européenne. Du Digital Services Act au Digital Markets Act, en passant par le Data Governance Act, les données, leur maîtrise et leur circulation sont au cœur de toutes les préoccupations. Pourtant, les données n’ont que leur usage de carburant en commun avec le pétrole. Ce dernier est une énergie fossile dont les ressources sont finies quand les données sont des biens duplicables à l’infini, c’est même leur caractère premier. Toutefois, alors que les données sont généralement considérées comme des biens immatériels, et non tangibles, elles n’existent pas sans reposer sur des infrastructures, des systèmes et des dispositifs, eux, bien matériels.
De cette double contradiction dans la manière dont nous considérons les données a longtemps résulté une vision biaisée de leur lien à l’environnement. Le numérique a d’abord été perçu comme une réponse à la transition énergétique, notamment dans sa capacité à rendre plus efficients les systèmes productifs, à optimiser l’usage de ressources rares, à éviter les déplacements des personnes ou encore à mesurer et réduire les consommations énergétiques. Il est aujourd’hui pointé du doigt pour l’ampleur de son empreinte carbone. Ce secteur industriel s’appuie sur des ressources naturelles, est très consommateur en énergie, produit de la chaleur et des déchets… Son impact sur le climat, de plus en plus questionné, tend à être de plus en plus documenté.
« 53% des consommations énergétiques du numérique seraient le fait du stockage des données »
Dès 2010, l’essayiste américain Nicholas Carr estimait que maintenir en vie pendant un an un avatar dans le jeu de réalité virtuelle Second Life consommait autant d'énergie qu'un Brésilien moyen sur la même période, soit 1 752 kilowatts-heure. Un an avant, un physicien de Harvard, Alex Wissner-Gross, calculait qu’effectuer deux requêtes sur le moteur de recherche Google représentait en consommation de carbone l’équivalent de deux tasses de thé préparées avec une bouilloire. Depuis, de nombreux travaux ont été menés pour réduire la consommation énergétique des data centers, voire utiliser l’énergie qu’ils produisent pour chauffer des bâtiments, comme OVH à Lille, ou dans le quartier de la Butte aux Cailles à Paris. L’Ademe estime cependant que le secteur du numérique est « responsable aujourd'hui de 4% des émissions mondiales de gaz à effet de serre et la forte augmentation des usages laisse présager un doublement de cette empreinte carbone d'ici 2025 ». Les données ne sont pas stockées dans les nuages, mais bien sur des serveurs physiques qui doivent être construits et alimentés électriquement, parfois très éloignés des utilisateurs : une donnée (téléchargement, vidéo, email, requête de recherche…) parcourrait en moyenne 15 000 kilomètres.
Ainsi, selon l’Ademe, 53% des consommations énergétiques du numérique seraient le fait du stockage des données et des infrastructures leur permettant de circuler (contre 47% pour les équipements des consommateurs). C’est tout le cycle de vie des produits qui à un impact sur l’environnement et tout particulièrement la phase de fabrication, « plus énergivore que la phase d'utilisation du produit par les consommateurs ». La plupart des composants sont en effet fabriqués en Asie, dont l'électricité provient du charbon, des composants complexes qui exigent beaucoup d'énergie, de traitements chimiques et de métaux rares. La phase de production des équipements occupe dont une part importante, près de 40% en 2019, dans l’empreinte carbone du numérique. Comme le relève le think tank The Shift Project, dans son rapport publié le 30 mars 2021, Impact environnemental du numérique : tendances à 5 ans et gouvernance de la 5G, « une bonne partie des enjeux environnementaux du numérique n’est donc pas liée à l’usage que l’on en fait, mais en grande partie au volume de matériel produit, à son processus de production, et à sa durée de vie. »
Usages vs infrastructures : chaque bout de la chaine a son importance
The Shift Project, dans son rapport, propose une série de scénarios prospectifs des impacts du numérique mondial en se basant sur deux types de variables : le « taux de décroissance annuels des ratios d’intensité énergétique », soit la consommation électrique unitaire des équipements et la consommation des réseaux et des data centers par unité de trafic, significatifs du progrès technologique et industriel ; le taux de croissance annuel des « volumes » numériques, divisé en production d’équipements d’une part, le trafic réseau et des data centers d’autres part, significatifs de l’évolution des usages.
Parmi les quatre scénarios de croissance - ou de décroissance - de ces variables sur la période 2020-2025 (voir fig.1), seul celui basé sur la décélération du trafic de données et la décélération de la production d’équipements permet de se projeter vers une stabilisation de la part du numérique dans la consommation d’énergie primaire mondiale. Le Shift Project estime ainsi qu’une « stabilisation de la consommation d’énergie par le numérique si nous parvenons à maîtriser nos pratiques de consommation » (scénario New Sobriety), notamment par plus de « sélectivité dans les usages vidéo, durée de conservation des smartphones allongée, priorisation des cas d’utilisation de l’IoT, etc. », permettrait que « la consommation d’énergie primaire n’augmente quasiment pas et que le ratio reste de l’ordre de 5 % jusqu’en 2025 » (voir fig. 2). Les trois autres scénarios (“Conservative”, “Growth”, “Growth less EE”) produiraient une augmentation de la part du numérique dans la consommation énergétique.
Ainsi, les sources de croissance de la consommation énergétique du numérique, si elles sont multiples, résident en grande partie dans l’explosion des usages et leur développement. Le Shift Project identifie cinq facteurs principaux de cette croissance :
- l’essor de la vidéo et de ses supports (TV, écrans publicitaires, etc.) ;
- le confort assisté (enceintes connectés, caméras de vidéosurveillance personnelles) ;
- la généralisation du smartphone ;
- l’essor de l’IoOT (Internet des objets) et de IIoT (Internet Industriel des objets) ;
- les besoins de traitement et de transport de données non absorbés par le progrès technologique : explosion du trafic de données mobiles, demande en capacité de calcul (IA, cryptomonnaies), edge computing (informatique en périphérie de réseau).
La protection des données… et de l’environnement ?
Chacun de ces cinq facteurs pourrait être lu à l’aune de sa consommation en données – notamment personnelles : l’usage des assistants vocaux et des enceintes connectées, que nous avons analysé dans le Livre Blanc « A votre écoute », pose aussi un certain nombre de questions quant à la protection des données des utilisateurs, mais aussi des enjeux écologiques. « Que ce soit en termes de production (par la fabrication massive de ces nouveaux dispositifs), de transit de données (par un fonctionnement se basant sur serveur distant) ou de capacité de calcul nécessaire au traitement de la voix, les assistants vocaux sont fortement consommateurs d’énergie. Ainsi, comme mis en lumière par le projet ANR DAPCODS/IOTics, le trafic généré par une enceinte se compte en centaines de kilo-octets, soit deux ordres de grandeur de plus que pour des objets connectés ne disposant pas de capacités de traitement automatique de la parole » (Livre Blanc, page 43). L’ensemble des actions proposées par un assistant, dès lors qu’elles ajoutent une surcouche de traitement et de transferts de données vont potentiellement accroitre la consommation énergétique des usages.
L’explosion des usages des caméras de vidéosurveillance personnelle, encouragée par la baisse des coûts des équipements, engage des coûts énergétiques supplémentaires selon le Shift Project, qui précise également que la vidéosurveillance figure parmi les activités que le développement de la 5G permettra de développer : « la généralisation et son développement dans les espaces publics et privés pourraient s’appuyer sur les capacités de la 5G en termes de débit de données et de nombre d’objets pouvant être simultanément connectés au réseau. Les flux vidéo ainsi générés 24 heures sur 24 viendraient doper la croissance du trafic à écouler par les réseaux mobiles mais également par les data centers ». La vidéosurveillance au travail et personnelle sont parmi les sujets pour lesquels la CNIL est de plus en plus sollicitée, par téléphone ou dans des plaintes. De même, la vidéosurveillance à des fins de sécurité publique (vidéoprotection) implique de plus en plus le recours à la « vidéo intelligente », notamment pour la reconnaissance faciale et le recours à l’IA, à propos desquels la CNIL appelle à un débat « à la hauteur des enjeux ». Ces technologies engagent ainsi des coûts pour les libertés autant qu’énergétiques.
Sur un thème que n’aborde pas directement le rapport du Shift Project, la publicité en ligne concentre à elle seule un certain nombre d’enjeux communs avec la protection de l’environnement. La CNIL a publié en 2020 ses recommandations relatives aux cookies, qui concerne un secteur autant consommateur de données que producteur de CO2 : une étude de 2016, publiée dans la revue "Environmental Impact Assessment", estimait que la consommation mondiale de la publicité numérique s’élevait à 106 térawattheures (TWh), 1,5 fois la consommation annuelle d’électricité de la Région Île-de-France pour la même année. La même estimait à 60 mégatonnes de CO2 les émissions de la publicité sur Internet.
Un lien de corrélation encore à démontrer
Il serait aisé de prendre ainsi chacun des usages du numériques à l’empreinte environnementale importante pour les relier à la protection des données. Pourtant, l’exercice inverse est également possible dans certains cas. Par exemple, le edge computing consiste à traiter les données à la périphérie du réseau, au plus près de la source des données : les données sont traitées par le périphérique lui-même, par un ordinateur ou un serveur local au lieu d’être transmises à un data center. Ces technologies, encouragées par la CNIL, représentent une opportunité pour la protection des données en ce qu’elles permettent de limiter le transfert, le stockage et le traitement des données en base centrale. Pourtant comme le pointe le Shift Project, le edge computing repose sur des systèmes moins optimisés énergétiquement que les plus gros data centers. Comme le pointe le rapport, « de nouvelles architectures déportant les capacités de traitement et de stockage des données au plus près des capteurs [..] mises en place pour que les services basés sur l’IoT et l’IIoT se développent effectivement [pourrait] entraîner une augmentation supplémentaire du parc d’équipements actifs, ainsi que de la dépense énergétique via la décentralisation d’instances d’intelligence artificielle et la multiplication de data centers d’agrégation ». Il pourrait être ainsi plus vertueux d’un point de vue environnemental de concentrer le stockage et le traitement de données plutôt que de promouvoir des architectures décentralisées même si ces dernières sont préférables pour la protection des données personnelles.
De même, la numérisation et la dématérialisation des services et notamment publics reposent d’abord sur des arguments de simplification et d’optimisation. Ils pourraient tout autant reprendre l’argument de la baisse des consommations induites par le recours à ces droits, par la limitation des déplacements, un argument largement repris pour promouvoir le numérique. La CNIL, comme nous l’indiquons page 36 du cahier IP8, Scènes de la vie numérique, « recommande régulièrement dans ses avis la mise en place d’alternatives au numérique pour l’accès aux droits ou aux services publics, dès lors que celui-ci est associé à la collecte de données. » Une demande légitime dès lors qu’il s’agit de laisser aux individus le choix de consentir à la collecte de leurs données, mais aussi dans une logique d’inclusion : nous ne sommes pas tous égaux ni agiles avec les services numériques. Pourtant d’un point de vue environnemental, la question de l’optimisation pourrait se poser : prendre son véhicule, rouler 20 kilomètres pour se rendre au guichet d’un service public aura une empreinte probablement supérieure à la réalisation de la démarche à distance (là encore, il s’agirait d’analyser l’ensemble du cycle de vie des produits électroniques).
Parmi les pratiques protectrices des données, mais consommatrices d’énergie, on pourrait également citer le recours au chiffrement, largement encouragé par la CNIL, qui nécessite cependant des capacités de calcul plus importantes. Comme le pointent Jiehong Wu, I. Detchenkov and Yang Cao dans un papier publié par l’IEEE en 2016 (A study on the power consumption of using cryptography algorithms in mobile devices), « les algorithmes de chiffrement jouent un rôle majeur dans les systèmes de sécurité de l'information. D'un autre côté, ces algorithmes consomment une quantité importante de ressources informatiques telles que le temps CPU, la mémoire et la puissance de la batterie ». Les technologies de la blockchain, sécurisées grâce à la cryptographie sont un des exemples pour lesquels la forte consommation énergétique est documentée, et commentée. Le bitcoin notamment, et son protocole basé sur la preuve de travail et la « validation par les mineurs », est une forme de blockchain très énergivore, comme « le réseau Bitcoin a une consommation électrique [avait] en 2019 entre 30 et 80 TWh par an et a une empreinte carbone de 15 à 40 MtCO2-eq, comparables à celle de pays comme l’Autriche, la Belgique ou le Danemark. » Si, comme l’indique Pierre Boulet dans un article publié sur EcoInfo-CNRS, d’autres formes de blockchain ont une empreinte moins importante, une analyse spécifique des différentes techniques de chiffrement, plus couramment utilisée serait utile à mettre en œuvre.
Un engagement et des travaux à venir
Si le lien entre les missions de la CNIL et la transition environnementale peut sembler peu évident, une lecture du RGPD sous l’angle de la sobriété numérique pourrait au contraire en faire un manuel de bons usages. Certains principes fondamentaux, tels que la minimisation de la collecte des données et la limitation de la durée de conservation, s’ils n’ont pas cet objet, peuvent contribuer aux objectifs de modération énergétique. Les paradoxes posés par le mythe du big data et ses conséquences sur l’écologie des données, portent en eux des risques comparables aux marées noires. Ce rapprochement entre sécurité des systèmes, protection des données et de l’environnement était au programme en 2019 de la 36ème édition du Chaos Communication Congress, dont le mot d’ordre était « Resource exhaustion », en référence à une technique d’attaque informatique et à la préservation des ressources. Parmi les solutions proposées, citées par Le Monde, Hannes Mehnert, proposait avec son projet MirageOS, de réduire la taille des systèmes d’exploitation, réduire au minimum le nombre de lignes de codes, un moyen selon lui pour réduire le besoin en ressources, mais aussi de limiter les risques de failles ou d’erreurs dans le code.
Ce parallèle entre frugalité numérique et sécurisation des systèmes s’inscrit dans un contexte où l’on constate de plus en plus de fuites de données, permises par la vulnérabilité des systèmes centralisés et les possibles conséquences en cas d’erreurs, de défaillances ou encore d’attaques. La fuite des données des 533 millions d’utilisateurs de Facebook révélée en avril 2021, mises à disposition sur des forums utilisés par des cybercriminels, ou celles des données de laboratoires d’analyse médicales, illustrent bien le parallèle avec les hydrocarbures, les données naviguant à la manière d’une nappe de pétrole sur l’océan, et pouvant provoquer des dommages. Des risques d’autant plus importants dans un contexte ou la recomposition des systèmes économiques au 21ème siècle et l’émergence des grandes plateformes s’est basée sur l’accumulation et la valorisation des données, à la manière dont les modèles industriels des 19ème puis 20ème siècles avaient reposé leur croissance sur l’extraction et l’accumulation des ressources naturelles. Dès lors, il convient de se poser la question d’une contradiction intrinsèque de la croissance de l’économie numérique, telle qu’elle s’est construite jusqu’à présent, et de la transition environnementale.
Fin 2019, la CNIL s’était engagée dans un manifeste commun avec sept autorités administratives indépendantes, à « accompagner l’évolution des acteurs […], éclairer la société qui les interpelle également sur ces enjeux », pour le respect des accords de Paris. Si la corrélation entre protection des libertés et environnement peut sembler évidente, il convient dans certains cas de rester prudent. Des questions qui méritent des recherches plus approfondies et qui feront l’objet de travaux prospectifs, de publications et d’expérimentations par le LINC dans les mois à venir.
Illustration : Creativity103, CC BY 2.0 <>, via Wikimedia Commons
Article rédigé par Régis Chatellier
, Chargé des études prospectives