Environnement : des données, des capteurs et des captés

Rédigé par Régis Chatellier

07 September 2021

Recouvrant de nombreuses réalités, formes et modes de captation, les données environnementales peuvent comporter des données personnelles et être soumises à la protection des données. Par nature, par destination, citoyennes, l'usage de ces données engage des questions de confiance, de transparence et de gouvernance.

Les données sont le pétrole de l’économie numérique ? Ou la cause de futures marées noires ? La solution aux maux environnementaux, ou un possible fardeau. Les liens entre numérique et climat, numérique et environnement restent à ce jour ambivalents. Il est cependant un domaine où de nombreux acteurs et militants se retrouvent : certaines données pourraient nous permettre de comprendre, analyser, quantifier nos impacts, à l’échelle individuelle et collective, et prendre des décisions en conséquence.
Le champ des « données environnementales » est très vaste, la forme de production et de collecte de celles-ci également, par nature, par destination, crowdsourcées ou citoyennes... Parfois elles se recoupent avec les données personnelles, voire les données de santé. Si la donnée ici doit agir en positif pour la protection de l’environnement, elle reste, comme toute donnée, sujette à précautions.

Qu’entend-on par données environnementales ?

Dans son rapport publié en juillet 2020, « Faire des données environnementales des données d’intérêt général », le CNNum propose une définition du concept de « données environnementales » à la définition composite et reposant sur différents textes. Cette notion repose notamment sur la convention d’Aarhus, de 2001, sur « l’accès à l’information, la participation du public au processus décisionnel et l’accès à la justice en matière d’environnement », et en France sur l’article L. 124-2 du Code de l’environnement qui en donne une définition extensive, soit « toute information disponible, quel qu'en soit le support », qui a pour objet l’état des éléments de l’environnement et leurs interactions (air, atmosphère, eau, sol, terres, paysages, etc.) ; les décisions et activités susceptibles d’avoir des incidences sur ces éléments (énergie, bruit, déchets, émissions, etc.) ; l’état de la santé humaine, dès lors qu’elle peut être altérée par des éléments de l’environnement ; l’analyse des coûts et avantages utilisées pour prendre des décisions ; et les rapports établis par les autorités publiques en lien avec l’environnement.

Cette définition très large traduit bien le caractère transversal des questions environnementales, et leur lien avec de nombreux champs, dont celui de la protection des données personnelles. Le CNNum propose de différencier les données environnementales par nature, des données environnementales par destination, à la manière dont la CNIL a défini les données personnelles de santé. Les données environnementales par nature sont, par exemple, les données et métadonnées géographiques, directement produites pour la connaissance et l’analyse du territoire. Les données environnementales par destination sont alors des données collectées et traitées au départ pour des usages qui ne sont pas en lien direct, mais qui peuvent renseigner sur des aspects de l’activité humaine. On retrouve dans cette catégorie les données de mobilité et de déplacements multimodaux, les données sur la consommation d’eau et d’énergie, etc.

Les données environnementales, à la manière des données de la ville numérique que nous explorons dans notre cahier IP5 Plateforme d’une ville, ont donc la particularité de se composer d’une multitude de données, provenant de sources différentes, privées, et publiques. Elles peuvent entrer dans le champ de la protection des données et du RGPD dès lors que celles-ci sont reliées directement ou indirectement à une personne, par exemple lorsqu’il s’agit de données de mobilité ou de données de santé, voire de données captées par des citoyens. La question de leur partage pour l’intérêt général, que nous développions dans la partie recommandation prospective, doit donc alors s’effectuer dans le respect des droits des personnes.

Smartphone, roi des capteurs

La diversité de ces données environnementales se retrouve également dans leur processus de production et de captation. Si des capteurs de données à grande échelle sont développés et installés pour mesurer la température, la qualité de l’air ou repérer des changements à l’échelle macro, les smartphones en ce domaine comme ailleurs, restent une source potentielle de données très riches et potentiellement très précieuses pour l’analyse de l’environnement. Cette méthode de captation avait reçu le nom de pocketsourcing, par la revue Wired, pour qualifier « l’utilisation des smartphones présents dans les poches des gens comme des capteurs passifs pour crowdsourcer des informations sur leur environnement et leur déplacement » (Cahier IP5, p. 25).

Chacun des capteurs disponibles dans les smartphones est en capacité de collecter des données que liste Moez Krichen (Université de Sfax), dans un rapport de recherche « Détection des anomalies environnementales via les capteurs des smartphones ». Ces capteurs peuvent renseigner sur des déplacements, mouvements et l’état de santé des personnes (GPS, capteur de proximité, LiDAR Sensor, podomètre, fréquence cardiaque), mais aussi sur des données directement environnementales. Le micro peut renseigner sur un niveau sonore ambiant, de nombreux smartphones sont équipés d’un baromètre. Si chaque smartphone est livré avec un thermomètre intégré pour contrôler la température à l’intérieur de l’appareil et éviter tout dommage, certains sont équipés de thermomètres supplémentaires pour mesurer la température ambiante. Plus rare, certains téléphones disposent d’un capteur de l’humidité de l’air ambiant. Au Japon, le Softbank Pantone 5, lancé en 2012 après la catastrophe de Fukushima, a été le premier (et le seul ?) smartphone doté d’un compteur Geiger, capable de mesurer le niveau de radiation ambiant dans la zone environnante, avec un niveau de précision de 20%. La mesure de la radiation avait fait à l’époque l’objet de cartographie participative, à partir de données mesurées par les citoyens, ou republiées de sites officiels.

Les données collectées par les smartphones sont aussi utilisées de manière indirecte pour l’aménagement urbain et la promotion du vélo en ville, comme le proposait dès 2016, l’application Strava. Le réseau social de partage de parcours sportifs propose Strava Metro aux villes et collectivités locales, qui peuvent avoir accès aux données agrégées de déplacement des cyclistes, qu’elles peuvent utiliser pour l’amélioration et l’adaptation de leurs infrastructures. Le même service avait fait la une des médias quand en 2018, des données publiées en open data de cette même plateforme avaient permis d’identifier assez précisément les activités à proximité de bases militaires « secrètes ». Le service Waze propose également sa plateforme de partage de données Waze Connected Citizen depuis 2015. Si ces données ne sont pas proposées pour des impératifs écologiques, leurs usages « par destination » leur confèrent le statut de données de données environnementales, dont la source première reste les smartphones des conducteurs.

Captologie citoyenne

Ces capteurs intégrés aux smartphones sont déjà utilisés à des fins environnementales. Des projets se basant sur le crowdsourcing de données de niveaux sonore ambiant sont développés dans le cadre de projets de recherche et mis à disposition du public sous forme d'application (NoiseTube, NoiseSpy, WideNoise). Ces services collectent les données audios captées par le micro des téléphones, associés aux données GPS pour créer des cartes de la pollution sonore en temps réel. Ces capteurs s’intègrent ainsi dans les infrastructures numériques en place (serveurs informatiques, applications mobiles, sites web) qui facilitent la circulation, le traitement et la mise en forme de ces données crowdsourcées et/ou citoyennes (Parasie, Dedieu 2019).

Les projets de captation participative et citoyenne de données par des profanes (lay people) n’ont pas attendu l’apparition des smartphones pour être utilisés par des groupes ou des personnes qui souhaitaient rendre visibles les préjudices environnementaux ou sanitaires qu’ils subissaient. Gwen Ottinger, dans une étude publiée en 2010, Buckets of Resistance: Standards and the Effectiveness of Citizen Science, étudiait notamment une mobilisation citoyenne en Louisiane aux Etats-Unis : des afro-américains vivant dans des zones défavorisées utilisaient des seaux (buckets) pour aspirer l'air ambiant à proximité d'une usine afin de le faire analyser, et ainsi démontrer aux autorités la réalité des pics de pollution qu'ils souhaitaient dénoncer.
Les formes de collectes citoyennes, ont de plus en plus souvent recours à des capteurs ou à des dispositifs spécifiques en complément des smartphones dont les capteurs, s’ils sont nombreux, ne couvrent pas tous les besoins et sont d’une qualité variable. Dans certains cas, le mobile est associé à des capteurs supplémentaires pour surveiller la qualité de l'air, les ultraviolets, etc. et intervient comme une "passerelle et un contrôleur", pour collecter des données et les transférer vers des serveurs distants. Les données remontées sont alors directement reliées à la personne. C’est sur ce modèle qu’avait été lancé dès 2009 le projet de Montre verte de l’association FING, un dispositif créé ad hoc, équipé de d’un capteur d’ozone et d’un capteur de bruit, relié en bluetooth à un téléphone mobile, doté d’un GPS.

La « captologie citoyenne » a longtemps rencontré la réticence des acteurs traditionnels et officiels de la production de données environnementales. Dans leur article, « À quoi tient la crédibilité des données citoyennes ? », publié en 2019 dans la Revue d’anthropologie des connaissances, Sylvain Parasie et François Dedieu rappellent que « ces capteurs numériques produisent en effet des mesures selon des procédés et des standards qui n’ont rien à voir avec ceux sur lesquels s’appuient les stations officielles – ces dernières mobilisant non seulement des équipements plus lourds et plus coûteux, mais aussi un ensemble de procédés métrologiques garantis par le droit et par des professionnels. […] Aussi bien aux États-Unis qu’en France, les autorités de surveillance de la qualité de l’air ont émis de profondes réserves à l’égard de ces dispositifs de mesure. » Ils notent dans leur étude menée auprès de trois associations californiennes engagées dans des projets de mesure citoyenne de la qualité de l’air, dont les membres co-construisent des protocoles de mesures avec l’autorité de régulation environnementale (EPA) et des universitaires, que « le fait d’étalonner les capteurs citoyens par rapport aux stations du gouvernement doit permettre de convaincre les autorités officielles de la robustesse des mesures ». Ce rapprochement a été possible grâce au California Assembly Bill 1550, qui en 2016 a imposé à l’EPA de consacrer 25% de ses budgets aux communautés défavorisées. « [Ces] capteurs citoyens [ont alors présenté] une opportunité pour les instances officielles de Californie, puisqu’ils permettent de produire des mesures de la qualité de l’air à l’échelle de ces populations, et ce à un coût beaucoup plus faible que celui qu’implique la construction d’une nouvelle station officielle. »

L’intérêt de cet « activisme par la donnée » ne réside pas non plus dans la précision de chacun des capteur – même s’il est possible de les étalonner – mais dans la dissémination de ceux-ci, et la capacité à relever finement les changements dans le temps et dans l’espace, avec des niveaux de mesures disponibles à l’échelon individuel. Ce nouveau type de collecte de données personnelles environnementales vient alors répondre à des besoins individuels et collectifs en matière de lutte contre la pollution. Ils représentent également une opportunité en termes de santé, en particulier pour le domaine scientifique de l’expologie (exposure science), qui vise à objectiver les conditions réelles dans lesquelles les individus sont exposés aux polluants. Alors que traditionnellement, la mesure de la pollution résidait dans la mesure macro, et moyenne, ces nouveaux dispositifs permettent des mesures individuelles et localisées, et un maillage territorial plus fin.

En France et en Europe, de tels dispositifs ont continué à s’étendre depuis la première expérimentation de montre verte en 2009. A Paris avec AirCitizen, à Rennes avec le LabFab, des ateliers sont organisés pour promouvoir les capteurs citoyens. L’association LabFab (Laboratoire de fabrication) anime depuis 2018 des ateliers de construction de capteurs environnementaux, et propose un modèle basé sur le capteur Sensor Community (d’abord développé en Allemagne), dont les mesures sont rendues disponibles sur une carte. L’association annonçait en 2020 que si elle n’avait au départ « pas de réelles garanties sur la fiabilité des mesures et donc des données […] avec plus d’une vingtaine de capteurs installés par des citoyens sur Rennes Métropole, [elle a] pu valider la qualité des mesures », notamment par la comparaison avec les niveaux de mesures officielles.

Le projet Sensor Community s’est développé dès 2014 dans le cadre de l’opération “Code For” de l’Open Knowledge Fondation (OKF) Germany, afin de promouvoir les données libres, les logiciels open source et la transparence de la vie politique. En 2016 un financement participatif a permis l’installation de 300 capteurs dans l’agglomération de Stuttgart, l’une de villes les plus polluées en Allemagne où il n’y avait que peu de données. Le projet a depuis essaimé, traduit en 26 langues. Les données produites commencent à être reconnues par les instances officielles, le Ministère de l’environnement des Pays-Bas en reprend les données sur ses cartes officielles. En France, Atmo Nouvelle Aquitaine a réalisé en 2020 une étude exploratoire de la fiabilité du capteur proposé. Des capteurs sont également développés par des entreprises, par exemple la startup française Plume Labs, qui commercialise un capteur de pollution portable, associé à un système de cartographie.

Captologie personnelle

L’ensemble de ces dispositifs et la collecte de données environnementales en général, comme pour tout autre type de données, se croise toujours plus avec la collecte de données personnelles. Dès lors que ces capteurs sont associés à un smartphone, une adresse IP ou une adresse personnelle, etc., les données produites entrent dans le champ de la protection des données personnelles et des libertés, et donc du RGPD.

Les usages environnementaux « par destination » de certaines données, par exemple des données de mobilité collectées par des applications dédiées, doit respecter le cadre juridique applicable pour le transfert puis le traitement de ces données. Il doit faire l’objet d’une base légale, a minima d’une information des personnes, de l’anonymisation et/ou du respect des droits des personnes. Il reste nécessaire dans tous les cas de garantir la transparence des différents dispositifs et de leurs finalités afin d’engager les citoyens au partage de leurs données. Comme le précise Moez Krichen, si les mécanismes de protection ne sont pas clairs pour les utilisateurs, « De nombreux participants sont conscients des conséquences possibles et peuvent par la suite hésiter à contribuer aux efforts de collecte de données et de détection des anomalies. »

Si le volontariat et l’activisme des personnes impliquées dans la captation citoyenne permet d’amener les personnes à comprendre et accepter, voire co-créer les politiques de confidentialité de ces solutions quant à la protection des données personnelles, le développement de processus de captation crowdsourcée et citoyenne devrait dépasser le cercle des activistes afin d’atteindre la masse critique. Convaincre de nouvelles personnes ne peut passer que par la mise en œuvre de systèmes transparents et de confiance sur le traitement des données personnelles et, en tout état de cause, l’ampleur et la durée de la collecte dépendent largement de la manière dont les données sont agrégées et réutilisées, soulignant à nouveau le rôle clé de la manière (plateformes, acteurs, gouvernance, etc.) dont sont centralisées ou exposées ces données dans le dispositif.

Des données d’intérêt général ?

Qu’elles soient d’origine citoyenne, crowdsourcées, ou collectées auprès d’acteurs commerciaux, industriels ou publics, ces données acquièrent le titre de « données environnementales » dès lors qu’elles présentent un intérêt pour l’intérêt général à préserver et/ou réparer l’environnement. Le rapport publié par le GIEC en août 2021 est là pour nous rappeler que ces questions ne concernent pas les seules franges militantes.

Le LINC avait dans son cahier IP de 2017 proposé des scénarios prospectifs pour le partage de données d’intérêt général « augmentée », afin d’étendre la notion de données d’intérêt général développées dans la loi république numérique de 2016, restreinte aux entreprises concessionnaires de service public, pour l’étendre à des acteurs privés hors relations contractuelles avec la collectivité. La recommandation proposait « d’ouvrir la voie à la restitution de certaines données fines à l’acteur public pour des missions de service public [d’intérêt général], charge à lui d’anonymiser ces données en cas d’ouverture en open data ». Ce scénario s’articulait avec des solutions complémentaires de mise à disposition de données par des acteurs privés sur base contractuelle, et au moyen de plateformes techniques de partage, et de processus citoyens de portabilité citoyenne : et de mise à disposition. Ces axes sont également repris dans le rapport du CNNum (page 34), qui propose pour les données du secteur privé des mesures d’incitation, par projet ou par le contrat, ou des mesures d’imposition, par la jurisprudence ou législative.

Dans la feuille de route numérique pour l’environnement, publiée par le Ministère de la transition écologique en février 2021, le gouvernement envisageait de « favoriser l’émergence d’espaces communs de données pour accélérer le partage de données entre acteurs privés et/ou publics », notamment pour « éclairer les politiques publiques à partir des données, en particulier dans les secteurs clés de l’agriculture, de la mobilité/logistique et de l’économie circulaire ». Il souhaitait également « réaliser un plan d’action pour la mobilisation de sources de données environnementales complémentaires afin de consolider les bases de données environnementales publiques gérées par l’ADEME.

A l’échelon européen, le projet de Data Governance Act prévoit de mettre en place des règles et des moyens pour un « altruisme de données », qui vise à la « mise à disposition de données sans rétribution, pour un usage strictement non commercial qui profite à des communautés ou à la société dans son ensemble. […] L'objectif est de créer les conditions appropriées pour que les particuliers et les entreprises aient confiance dans le fait que, s'ils partagent leurs données, elles seront traitées par des organisations de confiance, sur la base des valeurs et des principes de l'UE. » Les données environnementales, par nature ou par destination pourraient entrer dans ce cadre.

Si tous les acteurs semblent s’accorder sur le besoin de la constitution de ces « communs de données » pour exploiter au mieux les données environnementales, tout en prenant en compte les autres contraintes réglementaires (dont le RGPD), la principale difficulté liée à la mise en place de tels espaces est toutefois de créer ou soutenir des acteurs capables de produire les règles, de maintenir l’infrastructure et de fournir des conseils. Le développement de ces communs demande non seulement un consensus, mais aussi des investissements afin de déboucher sur des initiatives concrètes qui permettent le passage à l’échelle de ces pratiques. A ce titre l’initiative lancée par l’Institut Géographique National (IGN) en 2021 pourrait faire figure d’exemple. Après avoir ouvert ses données en 2021, l’IGN a lancé une initiative pour la constitution de géo-communs, « un ensemble de bases de données d’information géographique (production) et d’outils numériques (diffusion) accessibles au plus grand nombre ». Ces données environnementales (par destination selon la typologie du CNNum) auront vocation à être produites, diffusées puis gérées collectivement par une communauté selon un ensemble de règles de gouvernance, tout en reposant sur les capacités opérationnelles d’un acteur établi.

Engager des processus pour le partage des données environnementales pour l’intérêt général engage les mêmes questions que le partage de données urbaines ou de santé. Le champ des données environnementales est vaste, les moyens et les dispositifs techniques de collecte mis en place pour leur traitement sont tout aussi divers. La question de leur partage, de leur ouverture ou de la création de communs ne va pas sans risques associés à la protection des données et des libertés, d’autant plus lorsque les citoyens deviennent capteur, de manière proactive ou plus encore sans en avoir conscience directement. En ce domaine comme ailleurs, prise en compte de la protection des données ne doit pas être perçue comme un frein, mais agir comme un levier pour engager la participation et l’adhésion des citoyens.

Article rédigé par Régis Chatellier , Chargé des études prospectives

VOIR PLUS D'ARTICLES DE L'AUTEUR

Contenu annexe

Atelier de réflexion sur le RGPD dans la recherche scientifique

30 July 2025

Retour sur le Privacy Research Day 2025

29 July 2025

The explainability of AI in the era of deep learning

08 July 2025

Intelligence artificielle, IA