Quelle transparence pour les algorithmes d'apprentissage machine ?

(1)

HAL Id: hal-01791021

https://hal.inria.fr/hal-01791021

Preprint submitted on 14 May 2018

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

Quelle transparence pour les algorithmes

d’apprentissage machine ?

Maël Pégny, Mohamed Issam Ibnouhsein

To cite this version:

Maël Pégny, Mohamed Issam Ibnouhsein. Quelle transparence pour les algorithmes d’apprentissage

machine ?. 2018. �hal-01791021�

(2)

Quelle transparence pour les algorithmes

d’apprentissage machine ?

Maël Mégny

∗

Issam Ibnouhsein

†

Résumé

La notion de « transparence des algorithmes » a récemment pris une grande importance à la fois dans le débat public et dans le débat scien-tifique. Partant de la prolifération des emplois du terme « transparence » nous distinguons deux familles d’usages fondamentaux du concept : une famille descriptive portant sur des propriétés épistémiques intrinsèques des programmes, au premier rang desquels l’intelligibilité et l’explicabilité, et une famille prescriptive portant sur des propriétés normatives de leurs usages, au premier rang desquels la loyauté et l’équité. Parce qu’il faut comprendre un algorithme pour l’expliquer et en réaliser l’audit, l’intelli-gibilité est logiquement première dans l’étude philosophique de la trans-parence. Afin de mieux cerner les enjeux de l’intelligibilité dans l’emploi public des algorithmes, nous introduisons dans un deuxième temps une distinction entre intelligibilité de la procédure et intelligibilité des sorties. Dans un dernier temps, nous appliquons cette distinction au cas particu-lier de l’apprentissage machine.

Abstract

Recently, the concept of “transparency of algorithms" has become of primary importance in the public and scientific debates. In the light of the proliferation of uses of the term “transparency", we distinguish two families of fundamental uses of the concept: a descriptive family relating to intrinsic epistemic properties of programs, the first of which are in-telligibility and explicability, and a prescriptive family that concerns the normative properties of their uses, the first of which are loyalty and fair-ness. Because one needs to understand an algorithm in order to explain it and carry out its audit, intelligibility is logically first in the philosoph-ical study of transparency. In order to better determine the challenges of intelligibility in the public use of algorithms, we introduce a distinc-tion between the intelligibility of the procedure and the intelligibility of outputs. Finally, we apply this distinction to the case of machine learning.

∗_{Université de Paris 1 Panthéon-Sorbonne, IHPST, 13 rue du Four, 75006 Paris} †_{Quantmetry, 128 rue du Faubourg Saint-Honoré, 75008 Paris, France}

(3)

1 Introduction

La politique des algorithmes est couramment fort en vogue. Les algorithmes nous gouvernent, nous surveillent, nous profilent, et bientôt peut-être prendront notre emploi. L’enjeu de l’usage public des algorithmes est d’autant plus brûlant que, loin d’être des parangons d’objectivité scientifique, les algorithmes seraient racistes, homophobes, antisémites, sexistes ou classistes.

Bien des réflexions formulées à l’égard des problèmes politiques posés par l’usage des algorithmes pourraient se voir reprochées d’être un cas d’école de re-nommage de problèmes anciens. La philosophie, les sciences sociales et nombre d’œuvres artistiques ont déjà décrit et critiqué les absurdités et injustices pro-voquées par la complexité et l’opacité des processus de décision et règles qui structurent le fonctionnement des sociétés modernes. Bien des critiques aujour-d’hui adressées à l’usage social des algorithmes étaient déjà formulées dans la critique de la bureaucratie, de l’usage des statistiques et des benchmarks dans le débat public et la prise de décision.

Nombre des questions et des positions développées dans la discussion de la bureaucratie ou de l’emploi des statistiques se retrouveront assurément dans la discussion politique de l’usage des algorithmes. En effet, nombre d’algorithmes ne sont qu’une automatisation des procédures auparavant exécutées à la main, sans nécessairement en modifier la nature ni même la complexité. Sans nier que l’automatisation puisse avoir un impact nécessitant un niveau de réflexion propre, il semble nécessaire de veiller à ne pas sombrer dans un technocentrisme qui masquerait l’héritage intellectuel de la critique de la bureaucratie, attribuant ainsi aux algorithmes tous les problèmes dus à la complexité, à l’opacité ou à l’absurdité des décisions prises. Le technocentrisme qui mène si rapidement à parler de gouvernance par les algorithmes, de décision prise par la technolo-gie, ou d’intentions du programme servent alors d’écran dissimulant des enjeux politiques, éthiques et juridiques à la fois plus anciens et plus profonds.

Ces précautions prises, on peut partir à la recherche de ce qui fait la véritable nouveauté de l’usage des algorithmes dans nos sociétés. Sans prétendre épuiser le sujet, l’étude de l’apprentissage machine (AM) (machine learning en anglais) nous semble une voie d’étude privilégiée. L’AM, qui représente une variante par-ticulière de l’intelligence artificielle (IA) (voir Fig. 1)1_{, s’est largement développé} pour remédier aux situations où « la théorie de la décision aisément comprise n’est pas suffisante » [1]. Ils ne peuvent donc être décrits comme une simple au-tomatisation de procédures préexistantes. Ces algorithmes sont en outre réputés difficiles à comprendre, pour leur concepteur expert tout comme leur utilisateur profane, parce que leurs procédures d’optimisation sont précisément en rupture avec les modalités de raisonnement humain, et ne peuvent être aisément tra-duites en ces termes. Cette différence de nature technique, qu’il convient d’ex-pliciter, pose des défis radicalement nouveaux lorsque ces algorithmes d’AM sont utilisés pour étendre le domaine de la prise de décision automatisée. Sans prétendre exclure les autres catégories d’algorithmes d’IA comme les systèmes

1. Nous ne détaillerons pas plus avant les différents types d’IA, et laisserons le soin au lecteur d’approfondir les définitions de ces classes de modèles si besoin.

(4)

Figure 1 – Positionnement de l’AM parmi les techniques d’IA

experts ou les algorithmes génétiques, il nous semble pertinent, pour bien cibler les enjeux originaux posés par l’IA, de commencer par une étude centrée sur ces algorithmes d’AM. Ces derniers sont au coeur de nombre de développements scientifiques et industriels récents et ils constituent, du point de vue de l’en-semble de la communauté scientifique, la rupture épistémologique la plus nette par rapport aux procédures de décision classiques.

Les procédures d’AM posent un problème particulier pour l’un des grands enjeux du débat public sur les algorithmes, à savoir la « transparence des al-gorithmes »2_{. Cette notion complexe, dont la définition constitue précisément} l’un des principaux enjeux de cet article, renvoie en première analyse à notre capacité à comprendre les décisions prises par un algorithme, à nous assurer qu’il fasse bien ce qu’il est censé faire, et à éviter tout effet inéquitable. Ces en-jeux deviennent plus pressants pour l’industrie avec l’entrée en vigueur en mai 2018 du Règlement Général de Protection des Données (RGPD), où les ques-tions liées à la transparence jouent un rôle crucial. Notre problème sera donc de comprendre quelles exigences de transparence peuvent être définies pour des procédures d’AM difficiles à comprendre pour leurs propres concepteurs, en don-nant priorité aux enjeux épistémologiques.

Dans un premier temps, nous nous livrerons à une analyse conceptuelle gé-nérale de la transparence des algorithmes, pour en distinguer quatre sens fon-damentaux (section 2). Ayant montré que l’intelligibilité des algorithmes est l’aspect épistémologique fondamental de la transparence, nous explorerons cer-tains des défis particuliers que cette notion rencontre dans l’usage public des

2. Les récents développements en AM posent nombre de problèmes particuliers, qui ne se réduisent pas à l’application de l’exigence de transparence. Nous en évoquerons certains au cours de cet article, mais notre réflexion restera centrée sur la problématique de la transpa-rence.

(5)

algorithmes en introduisant une distinction entre intelligibilité de la procédure et intelligibilité des sorties (section 3). Enfin, nous appliquerons cette distinc-tion au cas particulier de l’AM afin de mieux cerner les enjeux épistémologiques particuliers posés par son intelligibilité (section 4).

2 La transparence des algorithmes

2.1 Le fantôme de la transparence : les mille sens de la

transparence

La notion de « transparence des algorithmes » a récemment pris une grande place dans le discours médiatique et académique. La transparence est présentée comme une vertu des algorithmes, ou de leurs usages. Celle-ci fait occurrence dans des contextes variés, et reçoit des définitions explicites diverses. Un effort de clarification conceptuel général semble nécessaire avant de préciser le rôle tout particulier que cette notion peut jouer pour l’AM.

Le terme de « transparence » est évidemment polysémique, et ce d’autant plus que la transparence a acquis ces dernières années le statut de vertu poli-tique privilégiée. Sans même rentrer dans les emplois foisonnants de ce terme dans le discours public actuel, nous allons voir que même dans le contexte de l’informatique ce terme est employé de manière très polysémique.

Avant de commencer notre travail de clarification, une précaution oratoire s’impose. Avec le développement de l’emploi des algorithmes dans tout un en-semble de contextes sensibles, le discours médiatique, mais aussi parfois le dis-cours expert, utilise abondamment des catégories intentionnelles, politiques et morales pour décrire l’action des algorithmes : les algorithmes sont loyaux, équi-tables, ou biaisés, racistes, sexistes, homophobes, etc. Soyons clairs : l’IA forte constitue toujours un fantasme lointain, qui bien souvent pollue le débat plus qu’il n’y contribue. Un algorithme doit fondamentalement être conçu comme une machine, et il ne peut pas plus être raciste qu’un moteur d’avion. Mais l’usage des algorithmes peut indiscutablement produire des effets de cet ordre, et un algorithme peut être explicitement conçu pour avoir un tel effet. Si l’usage d’un algorithme déborde bien souvent les intentions de son concepteur, il est cepen-dant déterminé par un ensemble de caractéristiques techniques intrinsèques de cet algorithme : impossible d’obtenir l’effet voulu avec un programme boggé ou trop complexe pour être exécuté sur l’architecture choisie, par exemple. Lorsque nous parlerons par la suite de « propriété intrinsèque » d’un algorithme, nous parlerons des propriétés qui peuvent être légitimement considérées comme des propriétés de l’algorithme lui-même sur la base de ses caractéristiques tech-niques, indépendamment de son contexte d’usage, et sans aucune attribution d’intentionalité à l’algorithme lui-même.

Il faut ensuite remarquer que le discours public a tendance à ne pas distin-guer « algorithme » et « programme ». Les termes sont parfois interchangeables dans le discours savant, mais il existe une distinction intuitive entre ces deux termes. Un algorithme est une entité mathématique décrivant une procédure ;

(6)

le programme est une entité technique, qui implémente un algorithme dans un langage de programmation donné. Il n’est pas à l’heure possible de donner une compréhension rigoureuse de cette distinction, puisque cela supposerait d’être capable d’identifier un algorithme à travers différents langages de programma-tion, et de répondre, au moins partiellement, à la question de la nature des algorithmes [2]. Mais cette distinction est cependant opérée à un niveau intui-tif, et elle joue un rôle heuristique important dans la pratique. La distinction entre programme et algorithme a-t-elle un rôle à jouer dans les débats sur les effets politiques des algorithmes ? Ou est-elle sans pertinence ? Il s’agit là d’une question difficile, que nous allons ignorer dans le cadre de ce travail.

Pour mieux cadrer le débat, il est nécessaire de distinguer sous le terme de « transparence » quatre notions indépendantes.

2.2 La loyauté des algorithmes

L’algorithme est loyal si le fonctionnalité affichée par son fournisseur3 au-près des utilisateurs correspond à la fonctionnalité connue du fournisseur. Si le fournisseur dissimule une fonctionnalité dont il a une claire conscience qu’elle est remplie par l’algorithme, alors l’algorithme sera déloyal. Nombre d’usages ac-tuels des algorithmes font malheureusement preuve d’une telle déloyauté : tarifi-cation volatile, personnalisation de l’offre commerciale réalisée selon des critères différents des critères affichés, recommandation de trajets basés sur la présence de points d’intérêts commerciaux, réponse à des requêtes sur un moteur de re-cherche donnant la priorité à des liens sponsorisés plutôt qu’à la pertinence, etc. On peut également parler de « déloyauté » lorsque l’algorithme, même s’il rem-plit les fonctionnalités affichées, remrem-plit en outre une autre fonctionnalité dont l’utilisateur n’a pas été clairement informé, comme par exemple la collecte de géolocalisation de l’utilisateur d’un smartphone à des fins commerciales4. Cette forme de déloyauté est aggravée si elle est implémentée par des applications qui n’ont aucunement besoin de collecter cette information pour fonctionner. On remarquera que dans le cas de la loyauté, l’attribution de cette propriété à l’algorithme est quelque peu abusive : l’algorithme n’est pas loyal ou déloyal, puisque cette notion suppose une intention de tromper qu’on ne peut guère at-tribuer à un algorithme. C’est la relation entre le fournisseur et l’utilisateur de

3. Nous emploierons les termes génériques de « fournisseur » et d’« utilisateur » pour dési-gner les parties prenantes dans une prestation algorithmique. L’utilisateur n’est pas forcément un client (notamment dans le cas d’un logiciel libre) et le fournisseur n’est pas nécessairement une entreprise, mais peut aussi être une association, un particulier, une fondation, une ad-ministration etc. Le fournisseur n’est pas non plus nécessairement le concepteur, mais l’on supposera dans la suite qu’il assumera les mêmes responsabilités que le concepteur auprès de l’utilisateur. Le rapport du CERNA ([3],22-23) distingue à juste titre entre le concepteur, qui conçoit le modèle, et l’entraîneur d’un modèle d’IA, qui choisit la base de données, la struc-ture et entraîne le modèle : il peut s’agir dans la pratique de personnes différentes. Mais nous considérons par défaut un modèle instancié, dont l’apprentissage est achevé : nous n’utiliserons donc pas cette distinction.

4. Pour une discussion plus approfondie des exemples d’algorithmes déloyaux, voir le site de TransAlgo [4].

(7)

l’algorithme, ou le fournisseur lui-même, qu’on peut en toute rigueur qualifier de loyal ou déloyal.

2.3 L’équité des algorithmes

Un algorithme est équitable si les résultats qu’il produit n’induisent pas un ef-fet discriminant ou biais à l’égard d’une catégorie particulière de la population5. La discrimination peut être introduite, de manière consciente ou inconsciente, prévisible ou imprévisible, au niveau de la conception de l’algorithme. Elle peut aussi être introduite, dans le cas de l’AM, au niveau de l’apprentissage sur un jeu de données, et peut donc dépendre des discriminations inscrites dans les don-nées elles-mêmes. Là aussi, les exemples abondent. Ainsi, les développeurs d’une application de la ville de Boston pour signaler les dégâts sur la voie routière ont dû corriger un biais favorisant les quartiers les plus fortunés : la collecte des don-nées était faussée par le fait que la probabilité de posséder un smartphone et de télécharger l’application était bien plus grande dans les populations les plus ai-sées ([6], 51-52). Dans des cas bien plus graves, les suggestions de requête ou les résultats des moteurs de recherche peuvent présenter des biais sexistes, racistes, ou antisémites (voir par exemple [7]). La présence d’effets discriminatoires peut être devenir extrêmement difficile à prévoir, et il faut faire preuve de prudence avant d’attribuer des intentions malignes au concepteur de l’algorithme.

Il est délicat de décider si l’équité est ou non une propriété intrinsèque de l’algorithme. D’une part, il n’est pas question d’attribuer à l’algorithme une in-tentionnalité discriminatoire. D’autre part, la propriété d’inéquité ne peut être systématiquement attribuée au fournisseur, ni à la relation unissant fournisseur et utilisateur, dans la mesure où l’inéquité peut être produite de manière invo-lontaire et même imprévisible. L’inéquité doit être attribuée aux effets sociaux de l’algorithme. Ces effets sociaux dépendent de caractéristiques techniques de l’algorithme, mais ne s’y réduisent pas a priori : ils dépendent de l’interaction entre l’algorithme et son contexte social d’usage. Il suffit d’imaginer un spambot sélectionnant des noms de personnes en fonction de leurs consonances pour leur envoyer un courriel. Selon qu’il s’agisse d’insultes racistes ou d’un extrait des Illuminations, on parlera ou non d’effets discriminatoires de l’algorithme. Pour-tant, d’un point de vue technique, les deux algorithmes peuvent parfaitement être considérés identiques à substitution du corps de message près. Il est donc délicat de parler de « propriété intrinsèque de l’algorithme » pour l’équité des algorithmes. L’équité est une propriété de l’usage social de l’algorithme, qui ne se réduit pas à ses caractéristiques techniques. Dans l’impossibilité d’une attri-bution simple de la propriété d’équité, nous continuerons donc à parler d’équité des algorithmes cum grano salis.

5. Cette définition, tout comme les trois autres, n’a pas la prétention d’être une définition juridique. On remarquera qu’elle recouvre à la fois les notions du droit américain de disparate treatment (utilisation explicite ou indirecte d’une variable protégée dans la décision) et de disparate impact (effet discriminant des résultats de l’algorithme sans traitement d’une va-riable protégée). Notre définition ne prend pas en compte le caractère intentionnel de l’effet discriminant, ou la possibilité pour l’accusé de plaider la nécessité de la procédure pour ses activités. Pour une introduction à ces questions de droit américain en AM, voir [5].

(8)

2.4 L’explicabilité des algorithmes

Un algorithme est explicable s’il est possible de donner à l’ensemble des uti-lisateurs, quelque soit leur bagage éducatif, une vision claire des procédures employées et des fonctionnalités remplies par l’algorithme, afin de permettre un usage informé6_{. Cette notion pose des problèmes de pédagogie de systèmes} technologiques complexes, et de la définition de la connaissance nécessaire à un usage informé. Il faut souligner dans ce cadre que les technologies d’information et de communication sont aussi utilisées par des enfants, ce que le RGPD prend explicitement en compte ([9], chapitre II, article 8). L’explicabilité est donc un enjeu non seulement pour s’adresser à un public sans aucun bagage technique en informatique, mais aussi à des personnes n’ayant pas les capacités psycholo-giques, les compétences cognitives ni même l’expérience de la vie d’un adulte. Pourtant, il sera également possible d’obtenir le consentement éclairé d’un enfant au titre du RGPD. Cette propriété est également cruciale pour les algorithmes participant à la prise de décision administrative, où l’opacité de fonctionnement induite par la complexité des procédures peut être légitimement attaquée par les citoyens. La loi pour une République Numérique créée ainsi l’obligation d’une mention explicite de l’existence d’un traitement algorithmique dans une prise de décision administrative individuelle, et la communication sur demande des règles de ces traitements et des caractéristiques principales de sa mise en œuvre ([10], article 4). De manière plus générale, dans tout secteur où les algorithmes jouent ou vont jouer un rôle important dans des prises de décision affectant de manière significative la vie de chaque citoyen (credit score aux USA, assurance, offre d’emploi, accès aux formations, etc.), l’explicabilité des algorithmes va de-venir un enjeu démocratique majeur, notamment pour permettre la possibilité de recours ou de demande d’informations.

L’explicabilité représente un enjeu tout particulier pour les modèles d’AM récents comme l’apprentissage profond. Pour ces modèles, non seulement le concepteur lui-même peut être incapable d’expliquer dans le détail comment l’algorithme a effectué son apprentissage et comment il prend ses décisions, mais il n’existe à l’heure aucune technique systématique permettant de deman-der aux systèmes de fournir une explication claire pour une décision donnée7_. Si ces algorithmes étaient utilisés dans des contextes où ils devraient prendre des décisions socialement importantes, comme conduire une voiture, accorder un prêt ou un entretien d’embauche, ou même refuser une mise en liberté, il serait parfois impossible de fournir la justification de la décision prise aux par-ties concernées. La prise de décision deviendrait une pure boîte noire impossible à contester en dehors du rejet global de l’emploi du modèle, piétinant le droit du citoyen à la demande d’information et à la formulation d’un recours. Si l’on reconnaît qu’une telle situation est juridiquement inacceptable, comme c’est clairement le cas dans le RGPD, l’explicabilité devient donc un enjeu majeur

6. Le terme de transparence (transparency) est utilisé en ce sens par Abdohalli et al. ([8], 31) quand ils la définissent dans le cas particulier des recommandations automatiques comme “revealing the reasoning behind the system’s recommandation".

(9)

de l’industrialisation de ces algorithmes. Cet enjeu est d’autant plus important qu’on ne peut exclure la possibilité de limites fondamentales à l’explicabilité des décisions prises par ce type de modèles. Certains chercheurs vont jusqu’à envisager que, tout comme le comportement d’un individu humain ne peut par-fois qu’être partiellement rationalisé tout en étant doué de sens, il est possible qu’une partie des décisions prises par l’IA ne puisse être capturée par une ex-plication verbalisable, et soit seulement descriptible comme une nouvelle forme de décisions instinctives [11]. Nous reviendrons sur ces enjeux dans les sections suivantes.

L’explicabilité est-elle une propriété intrinsèque de l’algorithme ? D’une part, l’explicabilité semble bien dépendre de propriétés techniques intrinsèques de l’al-gorithme, comme le montrent nos dernières remarques sur l’AM. D’autre part, il n’est pas évident qu’on puisse donner une seule explication d’un algorithme donné : la pédagogie pourrait avoir à s’adapter au public visé, produisant dif-férentes explications pour différents groupes d’utilisateurs. Dans cette optique l’explicabilité dépend elle aussi du contexte social d’usage. Mais il faut garder à l’esprit que la prolifération de représentations diverses d’un même algorithme pourrait poser des problèmes graves de communication, voire de responsabilité légale. Seule une réflexion approfondie sur la pédagogie des algorithmes, qui va bien au-delà de la portée de cet article, pourra décider s’il est préférable de promouvoir une explication fixée pour un algorithme donné, ou si l’explicabi-lité doit être comprise comme une propriété de la relation entre les propriétés intrinsèques de l’algorithme et le bagage intellectuel des utilisateurs. Nous nous contenterons ici de poser le problème.

2.5 L’intelligibilité de l’algorithme

Un algorithme est intelligible s’il est possible au concepteur de comprendre son fonctionnement et de vérifier s’il satisfait bien les propriétés désirées. L’in-telligibilité est une forme d’explicabilité fondamentale, qui porte sur la capacité des concepteurs à s’expliquer l’algorithme qu’ils conçoivent. Ses limitations sont dues aux limites de l’état de l’art scientifique, voire à des limites scientifiques fondamentales.

L’explicabilité comme l’intelligibilité peuvent renvoyer à l’anglais (human) interpretability, concept qui a pris son essor dans la littérature des toutes der-nières années et se voit maintenant muni d’une existence institutionnelle, avec un Workshop dédié de l’International Conference on Machine Learning. L’intel-ligibilité est parfois aussi nommée intelligibility. La DARPA a également lancé une initiative appellée Explainable Artificial intelligence (XAI), qui comprend entre autres un aspect explainable artificial machine : la notion d’explication employée recouvre à la fois l’intelligibilité et l’explicabilité [12].

L’intelligibilité constitue un enjeu majeur de la discipline informatique en général. Il n’est pas exagéré de dire que l’une des questions les plus fondamen-tales de l’informatique est « comment savoir si le programme fait bien ce qu’il est censé faire ? » Il se pose de manière particulièrement aïgue pour les IA, et en particulier les IA basées sur des mécanismes d’apprentissage profond dont

(10)

le comportement précis échappe encore à la communauté scientifique. Mais il se pose aussi déjà pour les programmes les plus conventionnels. Nombre d’al-gorithmes commerciaux séquentiels et déterministes peuvent poser de graves problèmes de spécification et de vérification. On sait que la majorité des pro-grammes n’est pas prouvée, et que la fiabilité des méthodes empiriques de cer-tification de programmes est une question complexe.

Examinons à présent les relations entre nos quatre concepts. La distinction entre l’explicabilité et l’intelligibilité ne fait pas problème, puisqu’elle renvoie à des différences de bagage technique manifestes. La distinction entre l’équité et la loyauté peut être plus complexe à établir selon les cas, mais la distinction conceptuelle n’est pas problématique : un fournisseur peut parfaitement livrer un algorithme déloyal mais équitable, ou produire un algorithme inéquitable tout en étant parfaitement loyal sur sa spécification, les effets discriminants pouvant être extrêmement durs à anticiper.

Ces concepts doivent être regroupés en deux familles différentes. Les concepts d’explicabilité et d’intelligibilité renvoient à des propriétés épistémiques des al-gorithmes. Les concepts de loyauté et d’équité renvoient à des propriétés nor-matives ou prescriptives, de la relation entre fournisseur et utilisateur, et des effets sociaux des usages. Pour grossir le trait8, on a donc affaire à deux fa-milles de significations bien distinctes du concept de transparence : une famille descriptive renvoyant à des propriétés des algorithmes, une famille prescriptive renvoyant à des propriétés de leurs usages.

La publicité du code source n’est une condition ni nécessaire ni suffisante de la transparence des algorithmes. Elle n’est pas suffisante puisqu’elle ne satisfait pas immédiatement aux conditions d’intelligibilité et d’explicabilité. Elle n’est sans doute pas nécessaire parce que l’intelligibilité des fonctionnalités du code peut être masquée au profane, et parfois même à l’expert, par la multiplicité des détails de l’implémentation. L’exigence de transparence des algorithmes ne remet pas en cause le logiciel propriétaire, et ne doit pas être confondue avec les revendications libristes.

Le glissement d’une famille de significations à une autre est rendu natu-rel par une dépendance conceptuelle essentielle. L’intelligibilité est évidemment la condition de possibilité de l’explicabilité : il faut comprendre quelque chose pour pouvoir l’expliquer. De manière plus générale, les propriétés épistémiques sont la condition de possibilité des propriétés normatives. Pour communiquer de manière loyale sur les fonctionnalités et pour garantir l’absence d’effets in-équitables, le fournisseur de l’algorithme doit avoir la capacité scientifique de comprendre son programme, d’anticiper ses effets, et de pouvoir l’expliquer à l’utilisateur. La notion d’intelligibilité se trouve donc au fondement de la notion de transparence.

Or cette capacité à comprendre de manière fondamentale les algorithmes est difficile à garantir en pratique pour les algorithmes conventionnels, et elle est à l’heure actuelle impossible à garantir pour nombre de procédures d’AM.

8. Le trait est quelque peu grossi, dans la mesure où nous avons vu que l’explicabilité pour-rait être dépendante du contexte social d’usage. Mais dans l’attente d’une étude approfondie de ce problème, la classification est éclairante en première approche.

(11)

Le fonctionnement interne complexe et en large partie mystérieux de ces der-nières dans certains cas d’application entraîne une opacité essentielle au plus haut niveau de la connaissance scientifique, qui rend pour le moins probléma-tique la vérification des trois autres propriétés. L’opacité de l’AM devient donc un problème fondamental pour la conception des normes régissant l’usage des algorithmes.

Il convient de noter que la prévisibilité du comportement de l’algorithme, qui est une composante de l’intelligibilité, est déjà un trait absent dans de nom-breuses créations techniques, en particulier pour certains algorithmes classiques considérés comme bien compris, parce que bien spécifiés et certifiés. L’imprévi-sibilité peut être due par exemple à l’application de l’algorithme à un type de données dont la particularité n’a pas été bien comprise par le concepteur (ges-tion d’excep(ges-tions), ou simplement au grand nombre d’opéra(ges-tions nécessaires à l’obtention du résultat. Dans le cas de l’AM, une autre forme d’imprévisibilité est cependant introduite par le fait que le concepteur même de l’algorithme ne dispose pas d’une représentation claire du mécanisme de prise de décision utilisé par la machine. Couplé à l’absence d’explication, on créé ainsi des machines à la fois imprévisibles et insondables (imprevisible and inscrutable, [11]).

2.6 Positionnement par rapport à la littérature

Notre analyse de la notion de transparence algorithmique vise à prolonger et à raffiner les distinctions conceptuelles opérées par la littérature existante, notamment le rapport du CERNA [3]. Ce rapport définit ainsi la loyauté :

La loyauté signifie que les systèmes se comportent comme leurs concepteurs le déclarent.

Cette définition, si elle est en soi parfaitement saine, ne permet pas im-médiatement de distinguer les problématiques liées à la tromperie délibérée de celles liées à un manque de compréhension de son système par le fournisseur. La responsabilité du fournisseur peut certes être engagée s’il fournit, sans au-cune intention maligne, un système qui ne correspond pas à ses fonctionnalités affichées. Mais dans le contexte de discussion de l’AM, où le manque de com-préhension du système par son développeur même est un enjeu majeur, il nous semble important de distinguer les enjeux d’offuscation des enjeux de maîtrise intellectuelle.

L’explication est définie en les termes suivants par le rapport du CERNA (ibid, 17) :

Expliquer un algorithme est faire comprendre à ses utilisateurs ce qu’il fait, avec assez de détails et d’arguments pour emporter leur confiance. Cette tâche est difficile même dans le cas d’un algorithme dépourvu de capacité d’apprentissage, comme l’illustre le débat au-tour de l’algorithme d’admission post-bac APB. En outre il convient de distinguer preuve et explication : ainsi Gilles Dowek donne l’exemple simple de la multiplication de 12345679 par 36, dont le seul calcul

(12)

du résultat (444444444) n’explique pas aux yeux d’un esprit mathé-matique pourquoi ce résultat ne comporte que des 4.

Cette définition, si elle n’est pas problématique en elle-même, ne distingue pas explicitement les enjeux d’explicabilité (explication à l’utilisateur) des en-jeux d’intelligibilité (compréhension experte d’une preuve et d’un résultat ma-thématique) : une telle distinction est absolument nécessaire pour les probléma-tiques de notre travail. En outre, elle ajoute une couche de complexité supplé-mentaire en introduisant la dimension de la confiance de l’utilisateur. Le rap-port du CERNA a raison de souligner que le consentement n’est pas uniquement fondé sur la compréhension rationnelle (ibid, 22), mais aussi sur la confiance. Sans prétendre qu’il soit aisé de traçer une limite claire entre saine pédagogie et rhétorique persuasive, nous ignorerons dans ce travail la dimension irration-nelle de l’obtention du consentement, et considérerons l’explication comme une entreprise visant exclusivement l’obtention d’une compréhension rationnelle de la part de l’utilisateur. Il s’agit assurément d’une abstraction grossière face aux complexités de la pratique, qui n’est justifiée que par la volonté de restreindre et de clarifier la portée de notre travail.

3 Problèmes de l’intelligibilité

Nous allons à présent interrompre notre réflexion générale sur la transparence des algorithmes, pour nous concentrer sur le problème particulier de l’intelligi-bilité. Ce dernier problème pourrait devenir particulièrement épineux pour les fournisseurs de solutions et services basés sur de l’AM une fois le RGPD en-tré en vigueur dans le droit européen, soit en mai 2018. Ce texte impose entre autres un « droit à l’intervention humaine » via des instances de contrôle, et un « droit à l’explication » pour l’utilisateur impacté par un algorithme d’aide à la décision ([9], Considérants, 71). Ceci constitue une contrainte majeure pour les concepteurs, et fait de l’explicabilité une propriété contraignant les réalisa-tions industrielles. Les Google Amazon Facebook Apple et Microsoft, également connus sous l’acronyme GAFAM, sont en bonne position pour développer les outils et processus facilitant la compréhension des résultats des modèles d’IA car ils ont, en tant qu’entreprises technologiques, une parfaite maîtrise du cycle de vie de la donnée, et contribuent déjà activement aux outils open source mis à disposition des développeurs dans le domaine de l’AM. Qui plus est, indépen-damment de toute contrainte légale, il est bon de rappeler qu’un utilisateur est moins susceptible d’utiliser un dispositif qu’il ne comprend pas, et dont il ne peut prévoir le comportement.

L’exigence d’explicabilité dans notre terminologie ne doit pas être confon-due avec la production d’explications plausibles mais fausses. Des stratégies pourraient ainsi être mises en place par des développeurs produisant de telles explications afin d’augmenter son acceptabilité, éventuellement en flattant les préjugés existants. Le RGPD tente de prévenir toute tentative d’enfumage en imposant que les explications soient données en des termes clairs, précis, utilisant une langue naturelle ([9], Considérants, 39). L’enjeu scientifique de

(13)

l’intelligibi-lité devient ainsi un enjeu juridique, économique et politique majeur, non pas uniquement pour l’AM mais en particulier pour l’AM.

Il faut souligner la force du cadre juridique proposé par l’Union Européenne (UE), qui interdit de fait nombre de pratiques encore légales à l’heure actuelle, comme la monétisation des données actuellement très répandue parmi les géants américains. Un tel cadre légal n’aura de sens que si, d’une part, il n’impose pas de contraintes irréalistes aux fournisseurs, et que s’il est d’autre part suffisam-ment bien conçu pour permettre au législateur de peser sur les industriels et de poursuivre et de sanctionner les infractions. Contrairement à ce que l’on pour-rait penser, les GAFAM sont en avance de phase de plusieurs années pour ce qui relève de l’accès aux données par l’utilisateur, la portabilité des données, ou encore le droit à l’oubli, en comparaison avec des acteurs classiques de l’écono-mie européenne comme les banques ou les assurances. Ils se montrent également beaucoup plus intrusifs dans la vie privée des utilisateurs de leurs plateformes, et une bonne part des revenus de Google et Facebook sont tirés de la monétisation de ces données privées.

Le nouveau cadre juridique proposé par le RGPD est ainsi voué à redistribuer les cartes dans la chaîne de valeur de la donnée, et il faut souligner l’importance pour le milieu industriel de ne pas adopter une attitude purement négative face à l’apparition de ces nouvelles réglementations. Contrairement à une idéologie à la mode, les lois et règlements ne sont pas qu’un frein à l’innovation. Pour reprendre la formule de Bryce Goodman et al. [13], les problèmes posés par la régulation européenne “are good problems to have”. Si la loi est bien conçue et n’impose pas de contraintes irréalistes ou trop précoces, elle peut être un stimulant pour des travaux de grande valeur, et source d’une réflexion profonde sur les propriétés des algorithmes. Du point de vue des applications, les défis scientifiques posés par le droit à l’explication peuvent mener à une interaction enrichie avec l’utilisateur et à une plus grande faculté de communication au sein des chaînes hiérarchiques [14].

Nous allons commencer par quelques remarques transverses sur l’lité en AM, avant de poser une distinction fondamentale : celle entre intelligibi-lité de la procédure et intelligibiintelligibi-lité des sorties.

3.1 Aspects transverses de l’intelligibilité en AM

Nombre de discussions de l’intelligibilité de l’AM peuvent enfermer le lecteur dans une opposition quelque peu rigide entre l’AM, doté d’un grand pouvoir prédictif mais inintelligible, et les algorithmes conventionnels, limpides mais moins puissants. C’est cette opposition qu’il faut commencer par nuancer.

La tension entre l’exigence d’intelligibilité et l’ambition des algorithmes de dépasser les performances sensorielles et cognitives humaines sur certaines tâches est certes indiscutable. Dans Hara et al. [15], on voit que les additive tree models doivent clairement leur performance à la division de l’ensemble des entrées en de nombreuses sous-régions (> 1000), ce qui rend le résultat difficilement com-préhensible. La substitution d’un arbre de décision rend le modèle plus simple, plus compréhensible mais aussi moins puissant au niveau prédictif. On a dans

(14)

cet exemple un facteur de taille clair dans l’intelligibilité, mais ce ne sera pas toujours le cas, et ce n’est pas propre à l’AM. L’exigence d’intelligibilité pourrait ainsi mener à renoncer au pouvoir prédictif qui fait toute la richesse des modèles d’AM.

Mais comme le remarque Lipton ([1], 5), un modèle d’AM réputé complexe comme un réseau de neurones n’est pas forcément moins intelligible qu’un mo-dèle appartenant à d’autres classes, comme les momo-dèles linéaires, les momo-dèles basés sur des règles, ou les arbres de décision. Une régression avec des centaines de paramètres covariables pourra être très difficile à interpréter. La profondeur des arbres de décision, des règles lourdes et une haute dimensionnalité du mo-dèle peuvent les rendre bien moins compréhensibles qu’un momo-dèle de réseau de neurones compact. Un modèle d’AM n’est donc pas systématiquement moins intelligible qu’un modèle d’une autre classe : il faut encore préciser de quels modèles on parle, quelles données sont utilisées, et ce que l’on cherche à rendre intelligible.

En outre, Krause et al. [16] soulignent à juste titre que l’intelligibilité n’est pas forcément une qualité nécessaire à l’usage de l’AM. Dans certains cas d’usage on sera parfaitement heureux avec un modèle prédictif puissant, comme par exemple le jeu d’échecs. L’explicabilité demeurera cependant une règle juri-dique prudentielle, qui s’imposera par défaut à tout programme, mais force est de constater que certains contextes d’usage poseront bien moins d’enjeux d’intelligibilité que d’autres. Le rapport du CERNA sur l’éthique de l’AM [3] suggère à juste titre d’adopter une attitude de compromis entre intelligibilité et pouvoir prédictif, dont l’équilibre exact sera déterminé par le contexte d’usage. De ce point de vue, le développement de l’AM pourrait mener à renoncer à certaines formes d’intelligibilité plutôt qu’à les imposer à tout prix, comme on a pu renoncer à trouver un modèle classique derrière les phénomènes quan-tiques. Si une telle attitude peut être admissible au niveau scientifique, reste à voir quelles exigences d’intelligibilité sont indispensables dans certains contextes d’interaction avec un utilisateur, et donc dans quels cas l’intelligibilité sera une qualité préférable au pouvoir prédictif.

Les modèles d’AM ne doivent cependant pas être réduits à leur puissance prédictive, et l’intelligibilité ne doit pas toujours être conçue comme une exi-gence antithétique au pouvoir prédictif qui serait le seul attrait de ces modèles. Au contraire, nombre de modèles d’AM sont censés nous aider à comprendre, en particulier à comprendre les grands ensembles de données [16]. Mais pour rendre les données intelligibles, ces modèles doivent eux-mêmes être intelligibles : l’in-telligibilité est alors la propriété cible du développement de l’AM, et non une exigence surajoutée.

Enfin, l’AM ne mène pas toujours à des formes de raisonnement exotiques incompréhensibles au commun des mortels : il peut au contraire mener à la découverte d’un trait simple et intuitif des données à côté duquel nous étions passé. Ainsi le malware detection neural network (voir [17], cité dans [18]) a obtenu d’excellentes performances de détection de logiciels malveillants en uti-lisant la qualité grammaticale des commentaires de code comme critère. Rendre l’AM intelligible peut être ainsi un moyen de réaliser la force d’idées simples et

(15)

intuitives.

3.2 Intelligibilité de la procédure et intelligibilité des

sor-ties

Comme le souligne Lipton [1], la notion d’interprétabilité ou intelligibilité dans notre terminologie, mérite d’être élaborée. Mais face à un concept si com-plexe, et si riche de connotations, il existe un véritable risque de prolifération terminologique, qu’on distingue l’intelligibilité selon ses objets (intelligibilité globale du modèle, intelligibilité des étapes de calcul, des composantes du mo-dèle), ses produits (production de certification, d’artefacts visuels ou textuels explicatifs, déboggage), ou ses modalités (intelligibilité comme compréhension qualitative du lien entrées-sorties, ou dans un formalisme rigoureux). Une telle prolifération terminologique, outre les graves problèmes de communication et de systématisation qu’elle pose, est aussi symptômatique de la difficulté à hié-rarchiser les différents problèmes soulevés par la notion, et à en donner une compréhension ordonnée.

Sans prétendre épuiser cette question épineuse, il nous semble crucial de distinguer entre l’intelligibilité de la procédure et l’intelligibilité des sorties de cette procédure9. La première prétend comprendre la procédure dans son en-semble, la seconde porte sur une exécution donnée de cette procédure. Les deux questions sont bien distinctes, dans la mesure où l’on peut prétendre avoir une bonne compréhension théorique d’un modèle sans comprendre la sortie particu-lière d’une exécution, et ce aussi bien en IA que dans la programmation la plus conventionnelle. À ces deux formes d’intelligibilité correspondent deux formes d’explicabilité, répondant à deux questions différentes : est-il possible d’expli-quer l’algorithme à un public profane, et est-il possible d’explid’expli-quer une sortie particulière au public profane ?

La distinction entre ces deux niveaux d’analyse doit être constamment main-tenue à l’esprit lorsqu’on examine d’autres aspects de l’intelligibilité. Ainsi, lors-qu’on parle comme Lipton [1] de l’intelligibilité des étapes du calcul, parle-t-on des étapes de la procédure en général ou des étapes d’une exécution particu-lière ? Lorsqu’on parle des défis d’explicabilité au grand public d’un modèle comme l’apprentissage profond, parle-t-on de la difficulté de faire la vulgarisa-tion des réseaux de neurones, ou parle-t-on de la difficulté à donner des raisons simples et claires pour une décision particulière ?

Cette relative autonomie des deux intelligibilités est essentielle à la fois au niveau théorique et au niveau pratique. Lorsqu’un consommateur ou un admi-nistré demande une explication sur une décision le concernant, sa demande est dans la grande majorité des cas une demande d’explication locale, arrimée à une intelligibilité de la sortie de la procédure de décision. Par exemple, si un administré demande pourquoi une aide lui a été refusée, la réponse attendue ne consistera pas en un cours de droit administratif sur les fondements juridiques

9. Cette distinction est déjà partiellement anticipée dans [19] et [20]. Nous adoptons le terme générique de « sortie » pour désigner aussi bien les décisions, prédictions, résultats numériques, graphiques et actions sur leur environnements produits par les algorithmes.

(16)

de la sécurité sociale, ou d’une vue d’ensemble des procédures de décision de la Caisse nationale des Allocations Familiales. Elle prendra le plus souvent une forme du type : « cette aide est réservée aux couples avec plus de deux enfants ». Ce type d’explication a l’avantage d’être à la fois simple et de permettre la for-mulation d’un recours. S’il était au contraire nécessaire d’exposer l’intégralité du fonctionnement d’un processus bureaucratique pour fournir une explication, l’interaction avec les usagers et leur droit à l’explication seraient fortement com-promis.

Ceci nous permet de voir une propriété essentielle des procédures bureaucra-tiques10 _{ordinaires. Dans ces procédures, conçues grossièrement comme un} en-chaînement de « si...alors...sinon... », la décision finale peut être conçue comme une combinaison de décisions élémentaires, simples et compréhensibles. C’est cette propriété qui facilite l’explicabilité d’une décision, malgré l’immense com-plexité des systèmes bureaucratiques modernes. Si la comcom-plexité de la procédure est fonction de la taille de l’intégralité du processus, l’explication d’une sortie consiste le plus souvent à extraire un court passage pertinent. Le caractère com-positionnel des procédures de décisions bureaucratiques permet d’autonomiser l’exigence d’intelligibilité de la procédure, de plus en plus difficile quand la taille croît, de l’exigence d’intelligibilité d’une décision donnée, qui dépend d’un critère de décision contextuel, souvent trivial.

Par conséquent, même si l’intelligibilité de la décision ne garantit pas l’intel-ligibilité de la procédure, ce trait n’est pas forcément problématique dans l’usage parce que celle-ci n’est pas systématiquement nécessaire à celle-là. La capacité à extraire une sous-partie pertinente de la procédure est fondée à la fois sur l’exclusion des branches inactivées de cette procédure —inutile de rappeler les clauses applicables aux étrangers de l’UE à un citoyen français— mais aussi à l’exclusion d’éléments activés mais non-pertinents —inutile de rappeler sa na-tionalité à l’administré qui se fait refuser une aide parce qu’il est célibataire.

Pour résumer, cette relative indépendance de l’intelligibilité de la procédure et de l’intelligibilité des sorties est fondée sur deux propriétés remarquables des procédures bureaucratiques ordinaires, à savoir leur compositionnalité et la ca-pacité d’extraire une sous-procédure brève, pertinente et compréhensible pour expliquer une décision particulière. Ce sont ces deux propriétés qui permettent aux processus bureaucratiques de croître en taille sans compromettre totale-ment l’intelligibilité et l’explicabilité des décisions particulières. Nous parlerons d’explicabilité par extraits pour désigner cette capacité à expliquer au profane une sortie particulière d’une procédure sans faire référence à l’intégralité de cette dernière, en sélectionnant un ensemble restreint d’éléments pertinents11_.

10. Nous entendrons ici le qualificatif « bureaucratique » dans son sens sociologique le plus large, qui décrit toute activité fondée sur l’exécution de procédures encadrées par des lois et règlements écrits. Ce sens large concerne aussi bien des activités administratives que des décisions juridiques, comptables ou commerciales.

11. Il nous faut bien souligner que nous parlons ici d’explicabilité et non d’intelligibilité. Du point de vue scientifique, qui est celui de l’intelligibilité, il n’y a pas d’autonomie complète de l’intelligibilité de la procédure et de l’intelligibilité des sorties : difficile de comprendre une sortie particulière sans avoir une idée de la procédure d’ensemble. Mais d’un point de vue pédagogique, et éventuellement juridique, il est possible d’expliquer une sortie particulière en

(17)

Ces dernières remarques permettent de souligner le caractère stratégique de l’intelligibilité des sorties pour l’industrialisation de l’AM. Il est certes difficile d’expliquer à un public profane le fonctionnement de l’apprentissage profond, mais cette difficulté de l’intelligibilité de la procédure n’est pas un problème propre à l’AM : nombre d’algorithmes conventionnels sont d’une grande so-phistication mathématique, et leur explication à un public profane poserait de graves défis. Mais c’est l’intelligibilité des sorties qui représente la majeure partie des enjeux d’explicabilité. L’intelligibilité des procédures d’AM sera d’abord un enjeu théorique avant d’être un enjeu pratique. D’un point de vue pratique, la question centrale est : puis-je justifier une décision particulière à l’aide de critères simples et intelligibles, sans faire référence à l’intégralité de la procédure12_?

C’est ici que l’AM peut poser des problèmes particuliers, en ce que les critères employés par la machine, notamment dans des tâches de classification, peuvent demeurer obscurs même pour l’expert (voir section 4). L’AM pose donc bien un problème spécifique d’intelligibilité des sorties, et donc d’explicabilité.

3.3 Droit et progrès scientifique : pour un comité dédié à

l’intelligibilité de l’IA

Tout état de l’art en AM n’est qu’une photographie d’un champ en mouve-ment rapide, auquel manquent des résultats fondamouve-mentaux structurants. Est-il possible d’avoir des algorithmes conventionnels aussi performants que l’AM en reconnaissance d’images, de sons et en traitement de la langue naturelle ? Est-il possible de traduire un algorithme d’apprentissage profond en une procédure de décision classique, ou une telle représentation est-elle fondamentalement im-possible ? Peut-on obtenir des modèles d’AM qu’ils produisent des logs compré-hensibles et des messages expliquant leurs décisions ? Toutes ces questions étant ouvertes, on ne sait pas à quel point l’irréductibilité de l’AM à des procédures plus classiques est fondamentale et définitive.

Un problème scientifique d’une telle profondeur est susceptible de demeu-rer ouvert pendant une longue période. Dans l’état actuel de nos connaissances scientifiques, avoir à l’égard des modèles d’IA des attentes d’explication stricte-ment équivalentes à celles formulées pour des algorithmes conventionnels n’est pas réaliste. Une interprétation stricte du droit à l’explication reviendrait à in-terdire l’emploi d’une bonne partie des modèles d’AM. Si une telle interdiction peut bien sûr être nécessaire dans certains contextes, une interprétation plus nuancée est désirable, non seulement pour le bien de l’activité économique mais aussi pour les autres bénéfices que certains modèles peuvent apporter à leurs utilisateurs.

extrayant quelques éléments de décision pertinents.

12. Il ne s’agit bien sûr pas de nier que certaines demandes d’explication exigent et exigeront une intelligibilité de la procédure. Mais il s’agit de souligner que le fonctionnement de nos systèmes bureaucratiques est fondé sur la possibilité de fournir, dans la majorité des cas, une explication des sorties sans fournir une explication des procédures, et que cette propriété devrait être conservée pour permettre un usage massif de l’AM dans la prise de décision bureaucratique.

(18)

D’un point de vue réglementaire, en particulier pour la mise au point des standards en termes d’explicabilité des programmes, il n’est donc pas possible de mettre en place un cadre juridique à la fois définitif et fort. Il faut alors tâcher d’avoir à la fois des recommandations opérationnelles dès à présent, et de maintenir une perspective prospective. Le RGPD encourage la mise en place, par les « associations et autres organismes représentant des catégories de res-ponsables du traitement ou de sous-traitants », de codes de conduite visant à préciser les modalités d’application du règlement, notamment les « informations communiquées au public et aux personnes concernées13_{» .}

Nous appelons à la mise en place d’un groupe de travail dédié à l’intelligi-bilité et l’explical’intelligi-bilité de l’IA, servant à la fois à la mise au point de standards d’explicabilité, à la veille scientifique sur le sujet, et à la mise à jour progressive des standards au fur et à mesure des avancées scientifiques. Nous venons de montrer que, d’un point de vue pratique, ce groupe de travail devra concentrer ses efforts sur l’intelligibilité des sorties, comme premier enjeu stratégique de l’usage public de l’IA en général, et de l’AM en particulier.

4 L’intelligibilité de l’AM

En guise de piste de travail pour ce groupe, nous proposons dans le reste de cet article une approche originale des enjeux d’intelligibilité et d’explicabi-lité en AM. Dans l’esprit des remarques présentées dans la section précédente, nous formulons cette approche en termes de distinction entre intelligibilité de la procédure d’instanciation d’un modèle d’AM et intelligibilité de ses sorties, ainsi qu’en termes d’intelligibilité des critères caractérisant le segment d’appar-tenance d’un exemple dans l’espace des données, depuis sa représentation initiale jusqu’à sa représentation finale en tant que sortie.

4.1 Instanciation d’un modèle d’AM : quelques rappels

Commençons par quelques rappels concernant la procédure d’instanciation d’un modèle d’AM. Le travail du concepteur d’un modèle d’AM se décompose en général en six étapes :

1. Formalisation mathématique du problème

2. Sélection d’un jeu de données adapté et définition d’un objectif final 3. Sélection d’une classe de modèles (régressions, arbres, réseaux de

neu-rones, etc.) et des algorithmes d’optimisation de ce que l’on nomme pa-ramètres et hyperpapa-ramètres du modèle

4. Instanciation d’un modèle par apprentissage sur les données 5. Production de sorties

6. Tests de performance le cas échéant, par exemple dans le cas des pro-blèmes dits supervisés où l’on dispose d’une variable à prédire, dont

(19)

l’historique des valeurs va servir, par comparaison avec les prédictions, de ground truth.

Détaillons les phases d’instanciation, de production de sorties et de tests de performance. Le jeu de données servant à la construction du modèle est généralement décomposé en trois parties :

— Le jeu d’entraînement : celui-ci sert à l’optimisation de ce que l’on nomme les paramètres du modèle, qui correspondent par exemple dans le cas d’un réseau de neurones aux poids des connexions une fois que le nombre de couches et de neurones par couche ont été fixés. Le concepteur peut choi-sir différents algorithmes d’optimisation des paramètres selon la classe de modèles choisie : descente de gradient (stochastique ou non) pour les régressions ou réseaux de neurones, des algorithmes gloutons comme le scindage binaire pour les arbres de régression et de classification, ou encore l’optimisation séquentielle pour les Support Vector Machines. La précision atteignable dans la détermination d’une solution est fonction de l’algorithme d’optimisation choisi, car certains algorithmes comme la descente de gradient stochastique “s’agitent" autour du minimum local et ne retiennent donc qu’une solution sous-optimale.

— Le jeu de validation croisée : celui-ci sert à la métaoptimisation des va-riables considérées comme fixes lors de la phase d’entraînement, que l’on nomme hyperparamètres du modèle, et qui dans le cas d’un réseau de neurones correspondent au nombre de couches et de neurones par couche ou encore à des variables techniques telles que le « dropout ». Les hyper-paramètres sont parfois fixés à l’issue d’une optimisation par exploration brute de toutes les possibilités, mais recourent le plus souvent à des heu-ristiques à la justification plus ou moins bien fondée. Bien souvent, c’est cette dernière étape qui constitue tout le savoir-faire industriel d’une en-treprise utilisant de l’AM, comme lorsqu’il s’agit d’optimiser un réseau profond pour l’analyse d’images.

— Le jeu de test : ce dernier ensemble, isolé dès le début de la procédure de construction d’un modèle, sert à en tester la performance sur des exemples qu’il n’a jamais vus, mesurant ainsi une capacité dite de géné-ralisation. Dans le cas d’un problème de classification, quatre métriques de bases de performance (vrais positifs, vrais négatifs, faux positifs, faux négatifs) sont regroupées dans ce que l’on nomme la matrice de confusion. Nous laissons le soin au lecteur de creuser si besoin ces définitions. On peut ainsi constater que la procédure d’instanciation d’un modèle d’AM est bien définie, et est parfaitement traçable via le code du programme et les divers mécanismes de suivi d’exécution de ce dernier. Cette compréhension de la procédure est fondée sur la bonne connaissance par les concepteurs des modèles d’AM de la nature et de la structure technique des données qu’ils manipulent14_, ainsi que du fonctionnement in abstracto des algorithmes employés. Par exemple,

14. Nous faisons dans toute la suite de cette partie l’hypothèse d’un jeu de données en entrée dont l’interprétation est simple, car un jeu de données en entrée complexe peut poser des problèmes d’intelligibilité pour des algorithmes simples et ne relevant pas nécessairement de l’AM.

(20)

imaginons que la frontière séparant deux classes d’objets caractérisés par deux variables (x1, x2) est circulaire. Il est évident qu’une régression logistique de de-gré 1 n’est pas pertinente, car elle ne peut générer que des frontières linéaires. De même, un réseau de neurones peut approximer n’importe quelle frontière entre exemples de labels différents grâce au théorème d’approximation universelle, même si ce résultat ne dit rien sur l’efficacité algorithmique de l’apprentissage des paramètres associés. Ainsi, le concepteur possède une intelligibilité claire des possibilités des algorithmes employés en tant qu’algorithmes, et des étapes de la procédure lui permettant d’instancier un modèle d’AM. Les heuristiques employées (en particulier lors du réglage des hyperparamètres), si elle peuvent générer un certain flou scientifique, ne constituent un problème qu’en vue de la production de sorties qui soient elles-mêmes intelligibles. D’un point de vue pratique, il est donc important de comprendre les obstacles sur lesquels peut buter le concepteur suite à une demande d’explication d’une sortie d’un modèle d’AM.

4.2 Quels obstacles à l’intelligibilité des sorties d’un

mo-dèle d’AM ?

Raisonnons sur une sortie particulière d’un modèle d’AM supervisé15: celle-ci correspond à un point dans l’espace de données final, lui-même fruit d’une possible transformation de l’espace de données initial par les étapes intermé-diaires du calcul du modèle instancié. Le point possède un voisinage au sein duquel la sortie calculée prend une valeur unique16 _{et dont les frontières sont} déterminées par l’algorithme d’AM à partir des données d’entraînement. Ainsi, dans l’exemple de l’arbre de décision de la figure 4.2 trois segments sont établis dans l’espace des données, caractérisés par des intervalles de valeur de vitesse du vent v et d’humidité de l’air h. Les frontières de ces segments correspondent aux règles de transition entre les noeuds de l’arbre. À chaque segment est associée une température moyenne unique calculée à partir des exemples d’entraînement présents dans le segment. Un nouvel exemple pour lequel le modèle instancié doit fournir une sortie correspond à un point de l’espace (v, h), et est situé dans l’un des segments établis par l’arbre. La valeur de la sortie calculée par l’arbre pour ce nouvel exemple correspondra à la température moyenne de son segment d’appartenance.

Deux cas de figures peuvent alors se présenter suite aux segmentations éta-blies par un modèle dans l’espace des données : soit les frontières étaéta-blies par l’algorithme sont explicites et formulées de manière intelligible, soit elles ne le sont pas. Ainsi, les arbres de décision sont considérés comme intelligibles juste-ment à cause du caractère explicite des segjuste-mentations qu’ils établissent dans un

15. Les analyses qui suivent s’appliquent également aux modèles non-supervisés modulo quelques adaptations du raisonnement et des résultats, mais il est plus simple de réfléchir dans le cadre d’un problème de classification ou de régression.

16. Par moyenne des valeurs des exemples d’entraînement dans le voisinage dans le cas d’une régression par exemple, ou par vote à la majorité dans le cas d’une classification.

(21)

Figure 2 – Exemple de segmentation dans l’espace des données établie par un arbre de régression. v et h correspondent respectivement à la vitesse du vent et à l’humidité de l’air, tandis que la variable à prédire est la température T . Les frontières des segments (à gauche) sont en correspondance avec les règles d’évo-lution dans l’arbre (à droite), et sont optimisées à partir des données servant à l’instanciation du modèle.

espace de données initial non transformé. Dans le cas des réseaux de neurones ou des méthodes à noyaux, il est souvent difficile d’avoir une définition explicite des frontières définissant le voisinage d’un point, voisinage au sein duquel une sortie homogène est calculée.

Plusieurs techniques ont donc été développées afin de permettre à l’expert de vérifier les facteurs justifiant la sortie d’un modèle d’AM instancié. Par exemple, l’analyse classique de l’importance des variables, ou encore la méthode Leave-One-Out Covariance (LOOC) qui consiste en relancer l’entraînement d’un mo-dèle en remplaçant les valeurs d’une colonne par une valeur non signifiante, mesurent l’impact relatif de chaque variable sur les prédictions du modèle. De même, les algorithmes de réduction de dimension, comme l’analyse en compo-santes principales ou encore l’algorithme t-distributed Stochastic Neighbour Em-bedding (t-SNE), permettent d’étudier les segmentations établies par un modèle sur des espaces de grande dimension en les projetant sur des espaces de dimen-sion plus petite. Enfin, des techniques plus évoluées comme les Local Interpre-table Model-Agnostic Explanations (LIME) construisent un modèle intelligible localement proche d’un modèle difficile d’interprétation, en se basant sur le pré-lèvement d’un échantillon d’observations autour d’un point quelconque, qui sert alors d’échantillon labellisé pour l’entraînement du modèle de substitution plus intelligible, comme un arbre de décision. Il faut noter que dans de tels cas, on établit localement une segmentation dont les frontières sont explicitables, et qui approxime la segmentation établie par le modèle original [21]. On peut d’ailleurs expliciter l’ensemble des frontières ou une sous-partie uniquement, selon le ni-veau de complétude pertinent et souhaité pour la description du segment17.

17. On peut bien sûr voir une analogie entre cette approche et l’explication par extraits d’une procédure bureaucratique. Quant à savoir si cette analogie doit être prise au sérieux, il s’agit là d’une question qui dépasse les limites de ce travail.

(22)

Ces techniques sont très utilisées quelle que soit la classe de modèles, la dif-ficulté de compréhension des sorties n’étant pas liée uniquement à l’algorithme, mais au couple données-algorithme, et en particulier à la transformation des données entre l’entrée et la sortie. Ainsi, ces techniques peuvent aider à com-prendre les décisions prises par une forêt aléatoire qui utiliserait des variables socio-démographiques et personnelles pour prendre des décisions quant à l’oc-troi d’un crédit. Mais dans certains cas d’application comme l’analyse d’image, la transformation de l’espace de données entre l’exemple (à la représentation intelligible) fourni en entrée et la sortie calculée est opaque, et l’explicitation des caractéristiques (exactes ou approximatives) du segment où se situe la sortie ou un point intermédiaire du calcul pourra ne posséder aucun sens du point de vue de l’utilisateur humain. Par exemple, dans le cas de la reconnaissance de chiffres sur une image de 8 pixels par 8 pixels en noir et blanc, un point de l’espace de données de départ va correspondre à une image parmi les 16 277 216 images possibles, et un point de l’espace de sortie à un vecteur de longueur 10 dont les valeurs sont comprises entre 0 et 1. Chacun de ces deux points est donc parfaitement intelligible pour un humain suffisamment expert, mais les transformations intermédiaires de l’espace de données initial aboutissent à des représentations du point d’entrée qui sont peu compréhensibles, et ce même si les segments les contenant sont caractérisés par des frontières explicites. En effet, ces frontières seront elles-mêmes définies en référence à des dimensions dif-ficilement intelligibles. Quant aux tentatives d’interprétation des résultats des couches intermédiaires d’un réseau de neurones comme des montées en abs-traction dans la représentation des données initiales, elles ne sont basées que sur de vagues analogies avec les propriétés des systèmes biologiques, et aucune approche formelle permettant d’interpréter sans ambiguïté la signification des couches intermédiaires d’un réseau profond n’est établie à ce jour.

L’intelligibilité des sorties d’un algorithme d’AM n’est donc pas toujours garantie, car même si les critères de production de la sortie peuvent être ap-proximés par des critères explicites, ces derniers ne sont pas nécessairement intelligibles, y compris pour un expert. De là naît le sentiment d’opacité en-tourant certaines applications de l’AM, en particulier l’analyse d’images par des réseaux de neurones profonds, utilisée en médecine ou encore en conduite autonome. Cette opacité rend en pratique difficile toute correction de compor-tement « locale », c’est-à-dire qui n’ait pas recours à une modification de la procédure dans sa globalité, et notamment à une nouvelle instanciation du mo-dèle modifiant par tâtonnement les heuristiques employées dans l’optimisation des hyperparamètres.

Mais le caractère explicite ou non des règles de production d’une sortie d’un modèle d’AM n’est pas le seul critère jouant sur la confiance que l’utilisateur place en de tels systèmes. En effet, ces systèmes statistiques possèdent par nature des sorties incertaines, et nous allons voir dans le suite que tous les algorithmes d’AM ne se valent pas pour ce qui relève de la gestion de l’incertitude.

(23)

4.3 Gestion de l’incertitude : le cas paradigmatique des

réseaux profonds

Avant d’entrer dans les détails de la gestion de l’incertitude par les différentes classes d’algorithmes d’AM, il convient de s’interroger sur la caractérisation des besoins menant à choisir l’emploi d’un tel algorithme en premier lieu, plutôt que d’autres méthodes a priori plus intelligibles. Quelles sont donc les caractéris-tiques des tâches pour lesquelles l’AM produit les meilleurs résultats connus ?

Il existe plusieurs pistes de réflexion sur cette question, qui ne sont pas né-cessairement exclusives les unes des autres. Doshi-Velez et Kim [20] affirment que c’est lorsqu’il existe une incomplétude fondamentale dans la spécification du problème que l’AM est le plus utile, mais que c’est également dans ces si-tuations là qu’il pose le plus de problèmes d’intelligibilité. Cette incomplétude est elle-même ancrée dans l’incapacité à fournir une paramétrisation complète du problème, d’où la nécessité d’une interaction machine-données-concepteur humain pour modéliser le problème et interpréter les résultats en sortie, par na-ture statistiques et donc incertains. La plupart des modèles d’AM visent alors à optimiser de manière heuristique une performance mesurée par un ensemble de métriques, comme les quatre métriques qui constituent la matrice de confusion évoquées précédemment pour le cas d’un classifieur.

Selon Lipton [1], les problématiques d’intelligibilité de l’AM surgissent à une étape ultérieure de la résolution du problème, à savoir lorsque les mé-triques usuelles de performances de l’algorithme (prédiction et ground truth) ne semblent pas suffisantes pour évaluer le travail de cet algorithme dans des circonstances d’usage réalistes. Cette caractérisation du problème de l’intelligi-bilité de l’AM n’est pas incompatible avec celle de Doshi-Velez et Kim : l’un des problèmes cardinaux de l’AM est de comprendre comment l’optimisation d’une métrique permet de réaliser une tâche à la paramétrisation insaisissable.

Un exemple permet d’éclairer le lien entre paramétrisation incomplète du problème, insuffisance des métriques statistiques de performances, et exigence d’intelligibilité du modèle d’AM. Considérons un classifieur qui réussit à classer les chiens et les loups de manière très performante en utilisant le décor en-vironnant : dans l’ensemble de données considéré, les loups sont plus souvent photographiés dans un décor comprenant de la neige en arrière-plan, ce qui n’est pas le cas pour les chiens (un exemple similaire peut être trouvé dans [22]). On considérera alors que ce modèle ne résout pas fondamentalement la tâche pro-posée, et la performance selon la métrique standard n’est pas suffisante pour détecter ce problème si les images utilisées pour tester la performance du mo-dèle présentent le même biais. L’IA suroptimisée fonctionne comme un élève qui devine les réponses d’une question à choix multiples en analysant le ton de son professeur : la bonne réponse a été atteinte pour des raisons circonstancielles liées à un environnement artificiel d’exécution de la tâche, qui ne peuvent être généralisées. Le succès prédictif devrait au contraire être révélateur d’une vé-ritable compréhension du problème. Pour obtenir une IA instanciée qui réalise vraiment la tâche voulue, et puisse voir son emploi généralisé, il ne suffit pas d’avoir juste : il faut avoir juste pour les bonnes raisons. L’intelligibilité des