[itw] Camille Girard-Chanudet nous invite au voyage au centre de la justice algorithmique en chantier

Rédigé par Régis Chatellier

 - 

02 janvier 2024


Dans une interview pour le LINC, Camille Girard-Chanudet nous propose d'explorer les coulisses de la fabrique des Intelligence artificielles de justice.

Camille Girard-Chanudet a pendant quatre années partagé son temps entre le Laboratoire d’innovation numérique de la CNIL, et l’École doctorale de l’EHESS, au Centre d’Études des Mouvements Sociaux (CEMS), dans le cadre d’une convention, afin de rédiger une thèse dirigée par de Nicolas Dodier et Valérie Beaudouin, soutenue le 4 décembre 2023 : La justice algorithmique en chantier - sociologie du travail et des infrastructures de l’intelligence artificielle,

Cette recherche nous propose d’entrer dans les coulisses d'une intelligence artificielle (IA) juridique en chantier, afin d’analyser les ressorts et implications sociales du développement de ces outils fortement controversés. Elle nous présente la trajectoire de ces objets techniques, ainsi que des représentations et tensions qui les accompagnent, depuis le monde de l’entreprenariat numérique jusqu’aux portes des tribunaux. Elle décrit les infrastructures informationnelles (des données au modèles) qui constituent le cœur du dispositif de l’IA juridique, et documente le travail de conception de l’IA.  

La thèse s'appuie notamment sur la conduite d’une ethnographie au sein d’une équipe pluridisciplinaire constituée à la Cour de Cassation, engagée dans la conception d’un outil d’anonymisation automatique des décisions de justice. Les données d'entrainement des algorithmes d'apprentissage automatique, en particulier, font l’objet d’annotation manuelle en amont. Fastidieux et souvent déconsidéré, ce travail du clic façonne pourtant une « vérité » de référence pour l’IA, qui conditionne en grande partie les résultats produits. L’enquête ethnographique permet de mettre en évidence la pluralité des compétences mobilisées par les acteurs chargés de l’annotation des données.

 

LINC : L’open data des décisions de justice est relativement récent en France, la justice prédictive l’est d’autant plus. Pourriez-vous d’abord revenir pour nous sur ce moment/mouvement dans lequel s’inscrit votre thèse ?

L’année charnière pour la justice algorithmique en France est 2016, au milieu d’une décennie caractérisée par la rencontre de processus technico-politiques spécifiques favorables. D’abord, les années 2010 sont celles de l’évolution exponentielle des capacités de stockage et de traitement numérique de l’information, qui a permis l’évolution des techniques d’apprentissage automatique et de ce que l’on a appelé le nouvel « âge d’or » de l’IA. C’est aussi la période d’un mouvement de réforme des administrations, inspirée du New Public Management et orienté vers la rationalisation de l’action publique, dans laquelle l’IA apparait comme un instrument qui pourrait favoriser une modernisation de la justice tournée vers la standardisation, l’efficience et la transparence de son activité. L’année 2016 est aussi celle de la Loi pour une République numérique, qui promeut le principe de mise en open data des décisions de justice, et provoque une forme d’appel d’air. 

Les quatre millions de décisions de justice produites annuellement par le système judiciaire sont alors envisagées comme un matériau exceptionnel, facilement exploitable par des modèles algorithmiques. Cette même année, plusieurs startups s’engagent dans la commercialisation de produits basés sur l’IA, suivies de près par des institutions judiciaires publiques (ministère de la Justice, cours suprêmes), qui elles-mêmes entament une montée en compétences en matière d’IA.

LINC : Justement, ce chantier de la justice algorithmique que vous décrivez dans votre thèse est peuplé de différentes formes de travailleurs et travailleuses, bien avant que n’entrent en scène les annotatrices de données sur lesquels nous reviendront. Pourriez-vous décrire ces différents mondes ?

L’introduction de l’IA dans le monde de la justice a produit une forme de reconfiguration dans les groupes professionnels, avec trois types d’acteurs : le monde de l’entrepreneuriat, le monde de la magistrature, et le monde de la modernisation publique.

Les startups qui se lancent en France dès 2016 dans la conception d’outils dits d’IA juridique sont à l’origine de l’émergence d’un secteur commercial dédié. Ces startups sont fortement connectées à l’écosystème de l’entreprenariat numérique, où l’on retrouve différentes formes d’incubateurs, dont l’emblématique Station F à Paris, et où se construit une culture partagée de l’innovation. Des espaces qui ont fourni des ressources pour la structuration de la « legal tech », qui réunit l’ensemble des acteurs positionnés a l’interface de la technologie numérique et du droit. Le groupe « French Legal Tech » de France Digitale, est par exemple créée en 2019, réunissant 23 entreprises du secteur de la numérisation du droit dont trois start-ups de l’IA juridique. Ces startups il faut le noter sont portées par des expertises marketing et technique, et restent relativement éloignées de l’expertise juridique traditionnelle. Elles se tournent  vers d’autres formes d’entrepreneurs, d’abord les fonds d’investissement pour des financements. Elles vont également se confronter aux maisons d’édition juridique, acteurs historiques du secteur, avec qui elles oscillent entre coopération et compétition. Enfin, les compagnies d’assurance vont jouer un rôle important, financeuses et clientes des solutions, elle souhaitent se substituer à la justice et « déjudiciariser », d’une certaine manière privatiser, certains types de contentieux. Pour elles, estimer le montant d’un dédommagement à l’issue d’une procédure serait très utile. Par exemple, une IA prédictive qui déterminerait le montant d’un dédommagement d’un montant de 3000 euros, à la suite de trois longues années de procédure, pourrait permettre à l’assurance de proposer un arrangement à l’amiable avec 1500 euros, tout de suite.

En parallèle de la constitution de ce réseau entrepreneurial, les startups de la legal tech doivent étendre leurs activités aux mondes traditionnels du droit : l’avocature et la magistrature, où les outils d’IA juridique connaissent une réception mitigée et hétérogène. Ces mondes sont parcourus d’importantes tensions et divergences, notamment autour d’une ligne de partage entre des professionnels de terrain d’une part, et une élite judiciaire d’autre part. Les praticien·ne·s y sont peu favorables, non pas à l’IA en tant que tel, mais intervient la crainte d’un traitement industriel de l’information, que ces outils soient utilisés par des personnes qui ne sont pas du terrain, à partir d’une nouvelle "légitimité algorithmique". Ces professionnel-le-s s’estiment confrontés à des problèmes urgents et bien différents, comme cette magistrate qui rappelle que dans les tribunaux, le manque de moyens est tel que l’on ne sait pas si on pourra acheter des timbres, que l’on ne dispose pas d’imprimante, etc. À l’autre bout de la chaîne, les élites judiciaires sont plus favorables et intéressées par les modes de production et d’encadrement des outils et voient d’un bon œil le rapprochement avec ces startups. Des ancien·ne·s magistrat·e·s dégagé·e·s, momentanément, ou plus durablement, de leurs fonctions juridictionnelles, occupent des postes de chargé·e de projet IA, par exemple au sein de la Chancellerie ou du SDER de la Cour de Cassation, et s’insèrent dans ces espaces réformateurs, avec une nouvelle forme d'expertise hybride.

Un troisième monde, celui de la modernisation publique, occupe une place charnière, a l’interface entre acteurs aux positions variées. La DINUM (Direction interministérielle du numérique) en est l’institution principale, notamment au travers de son programme EIG (entrepreneurs d’intérêt général). C’est en son sein que se formalise une nouvelle conception de l’IA, non plus commerciale mais modernisatrice, développée directement par les administrations et mise au service de la rationalisation, de la transparence et de l’autonomie de leur activité. Le monde de la modernisation publique fournit  les ressources nécessaires à la mise en œuvre de ces projets : moyens financiers, ressources méthodologiques et opérationnelles, compétences, réseau. Les EIG agissent dans ce cadre comme des agents intermonde entre public et privé. Ce programme consiste à recruter des « intrapreneurs », via la DINUM, qui sont intégrés à une administration candidate pendant dix mois pour réaliser un projet ou une preuve de concept. La Cour de cassation a ainsi déposé le projet LABEL, pour la pseudonymisation des données de justice, et a pu accueillir deux ingénieurs et une designer, qui avaient des expériences en startups, agence de conseil ou grandes entreprises, mais aucune dans le service public. C’est par leur circulation et leur activité que ces EIG façonnent progressivement une doctrine opérationnelle de la modernisation publique, en introduisant au sein d’administrations demandeuses des méthodes de travail et des outils qui leur sont étrangers, tout en prenant en compte d’éventuelles contraintes locales.

Ces EIG ne se considèrent pas comme des membres de la structure comme les autres, ils opèrent sous un statut différent de leurs collègues fonctionnaires, avec pour mission d’atteindre un objectif circonscrit et bénéficiant par ailleurs d’autres ancrages institutionnels et professionnels. Ils et elles valorisent particulièrement leur autonomie dans la conduite de leurs activités, et sont une représentation de l’Etat en mode start-up promu par les institutions modernisatrices.

 

LINC : Vous avez effectué une enquête ethnographique au sein de la Cour de cassation, engagée dans la conception d’un outil d’anonymisation/pseudonymisation automatique des décisions de justice. Vous avez notamment observé le travail des annotatrices, et les spécificités de ces fonctions.

La cour de cassation a en effet recruté en interne une équipe d’annotation, en majeure partie constituée de femmes, fonctionnaires de catégorie C en fin de carrière, pour beaucoup rattachées à l’institution judiciaire au sein de laquelle elles ont précédemment exercé diverses fonctions administratives. Ces « annotatrices » sont une vingtaine au moment de l’enquête, intégrées au pôle open data, qui compte trente personnes au total. Elles agissent dans un arc de travail où l’on retrouve trois moments : la problématisation, caractérisée par la définition d’un cadre catégoriel par des professionnel·les légitimes de ce que constituent les « termes identifiants » à occulter des décisions ; l’annotation, qui décrit l’effort d’application par l’équipe d’annotation de ce cadre catégoriel a la réalité des décisions ; enfin, le dispositif algorithmique et la phase d’automatisation des activités de pseudonymisation, conduite principalement par les data scientists, qui convertissent des annotations manuelles en vecteurs mathématiques.

Le cadre catégoriel sert de socle aux activités d’annotation, qui elles-mêmes constituent le fondement du dispositif algorithmique, avec des systèmes d’aller-retours et d’ajustements permanents.

Ce travail de définition du cadre de pseudonymisation des données de justice est très spécifique, dès lors qu’il ne s’agit pas d’anonymisation stricte telle que définie par les autorités de protection des données, dont la CNIL. C’est un travail « de bon sens » selon les personnes interrogées et un processus itératif qui a permis de définir les catégories de données identifiantes, par des acteurs « légitimes », le plus souvent des magistrats.

Les annotatrices interviennent dans un deuxième temps, pour éprouver ce cadre à des données réelles, avec un travail de labellisation manuelle des décisions et de correction des résultats produits algorithmiquement. Elles parcourent le texte intégral des décisions de justice sur une interface informatique dédiée, et elles y reportent minutieusement l’ensemble des termes correspondant aux catégories identifiantes établies. Il s’agit d’une succession d’enquêtes pour faire correspondre des éléments figurant dans le texte avec la catégorie adaptée. Cela peut se faire simplement, par exemple « Madame Dupont » ira sans difficulté dans la catégorie « nom de famille ». D’autres cas sont plus complexes et n’entrent pas directement dans le cadre. Par exemple, le nom d’un cheval pourrait permettre d’identifier rapidement son propriétaire, sans qu’une catégorie soit prévue.

La lecture précise et l’annotation de plusieurs dizaines de décisions quotidiennes, parfois très longues (plusieurs dizaines de pages en moyenne), représente un défi répété, tant sur le plan attentionnel que physique et suppose la mobilisation de compétences plurielles.

Pour cela elles s’appuient sur des sources d’informations extérieures : recherches internet, échanges avec les collègues… mobilisent également une connaissance ordinaire du monde social. C’est à partir de leurs propres représentations et expériences personnelles qu’elles concluent au caractère identifiant d’une entité et l’associent à une catégorie particulière. Par exemple, une annotatrice va « jusqu’à anonymiser le lieu des prisons, des centres de rétention administrative », parce qu’elle les considère « entre guillemets, comme un domicile » même si « ce n’est pas vraiment un domicile ». Leur expérience professionnelle passée leur permet de prendre en compte la fragilité supposée des personnes impliquées dans les jugements. De la même manière, l’équipe d’annotation accorde de l’importance à la lisibilité des décisions anonymisées, avec un grand soin porté aux termes de remplacement, bien que cela ne relève pas de leur compétence, mais directement de la première présidente de la Cour de Cassation. Pour cela elles effectuent régulièrement des allers-retours entre leur document de travail et la fonctionnalité « vue anonymisée » de leur logiciel.

Loin de l’apparent automatisme qui leur est souvent associé, cette activité est empreinte pour les annotatrices d’une forte dimension « morale », qui contribue à en orienter les résultats. L’attention et le soin porté est en décalage avec la position de simples « exécutantes » dans laquelle le reste de l’équipe open data semble souvent les dépeindre. Les annotatrices se sentent très responsabilisées, elles sont le maillon de la chaine qui prend soin des personnes.

 

Aller plus loin :

Camille Girard-Chanudet

 

Après s’être formée en politiques publiques à Sciences Po, Camille Girard-Chanudet soutient en 2023 à l’EHESS une thèse en sociologie consacrée au à la fabrique d’outils d’intelligence artificielle appliqués au domaine judiciaire. Ses recherches mobilisent les outils de la sociologie des sciences et des techniques, de l’activité et de la modernisation de l’action publique, pour mieux identifier les enjeux politiques et sociaux associés au développement des technologies algorithmiques.

Voir aussi, les dix articles rédigées pour le LINC depuis 2018.



Illustration
Armand Kohl (1845-1900s) - Bibliothèque nationale et universitaire de Strasbourg (en ligne), Public Domain


Article rédigé par Régis Chatellier , Chargé des études prospectives