• Aucun résultat trouvé

Enjeux de souveraineté numérique et de la maîtrise des données d’apprentissage

Dans le document Éducation et numérique, Défis et enjeux (Page 79-83)

Le concept de souveraineté84 est largement associé aux principes du pouvoir

régalien des États. Mais la numérisation du monde ouvre de nouvelles perspectives souvent traduites par la question de la souveraineté numérique et l’irruption de grands acteurs industriels prétendant de plus en plus assumer des fonctions régaliennes85.

On peut aborder la question de la souveraineté numérique selon deux facettes. D’une part, la question de la conception des algorithmes et des optimisations/ décisions calculées/prises par les logiciels qui les implémentent, et d’autre part la question de la maîtrise des données et plus généralement des contenus.

Commençons par rappeler qu’un logiciel est une œuvre de l’esprit et que son développement n’est pas « neutre » : même avec un cahier des charges très précis, il subsiste le plus souvent des choix d’implémentation que le développeur prend à sa charge. Il est clair que la personnalité, la culture, voire le genre peuvent influer sur le produit final. On observe le débat actuel sur les algorithmes qui ont pour but de recommander des vidéos ou d’acheter des objets en ligne ; cette influence est actuellement décriée (débat sur la neutralité des algorithmes) mais la question est encore plus cruciale pour des systèmes touchant à l’éducation, socle commun de la culture d’une nation et de son futur.

Dans ce contexte particulier, il est nécessaire de s’interroger sur la nature des contenus pédagogiques : quelles approches ? quelles séquences ? Sans porter de jugement, ni établir de classement, les approches pour apprendre à lire, écrire, compter ou raisonner présentent des différences en France, en Amérique ou en Asie. Certes, il est envisageable de développer des solutions pouvant accueillir des contenus différents mais cette intégration n’est pas forcément simple et des « rigidités » logicielles peuvent restreindre la mise en œuvre de certains aspects spécifiques à un système éducatif. Il est donc indispensable de s’assurer que les enseignants ont la possibilité de choisir dans l’offre pléthorique de produits qui leur seront proposés, en utilisant un critère de respect des approches pédagogiques qu’ils ont choisies et pas juste de retenir des produits « s’en approchant ».

84. https://fr.wikipedia.org/wiki/Souverainet%C3%A9

85. À titre d’exemple, on peut citer l’émergence de monnaies ou d’actes notariés basés sur la blockchain ou encore des capacités de chiffrement proposées par des sociétés spécialisées.

5.1

« […] un logiciel est une œuvre de l’esprit et son développement n’est pas “neutre” : même avec un cahier des charges très précis, il subsiste le plus souvent des choix d’implémentation que le développeur prend à sa charge. »

L’autre point primordial à traiter concerne la maîtrise des données d’apprentissage récoltées par ces logiciels éducatifs. Ces données et leur exploitation statistique (academic analytics) peuvent permettre au système éducatif et notamment l’Éducation nationale, s’ils s’en emparent, de faire un meilleur pilotage à travers la remontée d’informations statistiques de type tableau de bord. On notera également que l’accès à ces données pourrait être une chance pour la recherche en sciences de l’éducation86. La question de souveraineté est alors de savoir qui en a la maîtrise.

Il s’agit en effet d’une véritable « mine d’or » qui génère(ra), si l’exploitation est laissée au seul secteur marchand, beaucoup plus de bénéfices que la vente du produit de type manuel scolaire87. Ce modèle économique bien connu maintenant

dans d’autres secteurs, vise à agréger ces informations, éventuellement les croiser avec d’autres sources pour créer des « profils » d’utilisateurs très précis qui sont ensuite monétisés, soit directement par l’entreprise récoltante, soit indirectement en les revendant à d’autres sociétés. Cette approche a d’abord été observée dans des navigateurs Web où les comportements d’un utilisateur sont analysés pour ensuite lui proposer des achats ciblés sur ses goûts.

Dans le cas de la formation, la monétisation portera sur les capacités d’apprentissage d’un apprenant (lycéen, étudiant, adulte) qui seront ensuite vendues à des entreprises de « placement » avec un objectif de rentabilité à court terme sans forcément prendre en compte l’intérêt à long terme de l’apprenant.

Un autre aspect de cette nécessaire maîtrise des données réside dans le respect de leur confidentialité. Acceptons-nous que les informations concernant nos enfants (ou nous-mêmes) soient revendues à des sociétés marchandes pour ensuite leur faire acheter des produits ou des services ? Il y a là une question éthique de fond qui doit être débattue publiquement et pas oubliée implicitement par des « décideurs » qui choisissent un produit sans vraiment se préoccuper de ces interrogations. La transparence sur ce sujet est absolument indispensable pour établir une véritable confiance dans notre école.

86. Voir p. ex., le projet Hubble [Luengo&al-2019].

87. On notera que le CEO de Google annonce plus de 100 millions d’apprenants/professeurs sur Google

LE CAS DES NOTEBOOKS POUR LE DÉVELOPPEMENT LOGICIEL

Depuis quelques années, on assiste au développement d’outils numériques autorisant un travail collaboratif basé sur le partage d’informations de différents types : texte, multimédia mais aussi du code qu’il est possible d’exécuter directement dans l’environnement. Citons p.ex. le projet Jupyter Notebbook lancé en 2015 par Fernando Pérez et récompensé du ACM Software System Award en 2017, notamment les Notebooks associés au MOOC Inria consacré à l’apprentissage du langage Python qui propose des exercices aux apprenants. Ces outils rencontrent un succès grandissant tant dans le monde de l’entreprise que dans celui de l’éducation et de plus en plus d’étudiants les utilisent.

Il est donc facile de prévoir que dans quelques années, ces outils, inconnus il y a peu, seront au cœur du développement des systèmes numériques. Que se passera-t-il si, au lieu d’utiliser des solutions assurant la protection des données dans le respect de notre législation nationale et européenne, ces ingénieurs et concepteurs travaillent avec des plates-formes de ce type mais développées par les leaders dominants qu’ils soient américains ou chinois ? Concrètement, elles auront un accès direct à la conception des produits et innovations des entreprises européennes. Est-ce acceptable ?

Enfin, mais ce n’est pas le moins important, l’ouverture des systèmes choisis doit être assurée. En effet, il s’agit de s’assurer que l’utilisation d’un logiciel n’entraîne pas de limitation dans les autres choix, à cause de solutions technologiques bloquantes. On pense d’abord à la question du format des documents : certains produits imposent des choix dits propriétaires qui ne permettent pas leur (ré)utilisation dans d’autres systèmes. Ensuite, les interactions entre logiciels ou entre systèmes sont devenues monnaie courante dans beaucoup de contextes – on parle alors d’interopérabilité – il faut bien entendu veiller à ce que les systèmes retenus les autorisent. Enfin, et de manière plus fondamentale, il s’agit de garantir la portabilité des données et la réappropriation par les apprenants de leurs propres données d’apprentissage88. Le

règlement général pour la protection des données (RGPD) édicté par l’Europe est un socle de solutions mais qui est loin d’être suffisant car la compréhension de comment le mettre en oeuvre doit être au coeur de la conception des systèmes d’information des établissements de formation (éducation nationale, enseignement supérieur, etc.), ce qui ne peut être guidé que par des principes généraux de gouvernance (voir p. ex., https://www.anewgovernance.org/). Il s’agit donc, au sein du cadre juridique

88. On peut constater qu’actuellement, un élève qui change d’académie en cours de scolarité perd toutes ses données de résultats scolaires à moins qu’il en ait gardé une trace papier !

du RGPD, de construire un modèle qui permet la circulation et la réutilisation de ces données, au profit de l’élève, du corps enseignant et plus généralement de l’école et du ministère, des parents, des chercheurs et des entreprises des EdTechs dans un modèle qui doit être vertueux, permettant à chaque acteur par sa contribution d’en tirer de la valeur. Un exemple intéressant est promu par l’ONG MyData, avec son modèle de contrôleur de données (https://mydata.org/operators/).

Un rapport des inspections générales IGEN et IGAENR89 publié en février 2018

indique qu’« il est essentiel de réaliser que la souveraineté en matière de numérique ne repose pas uniquement sur le contrôle mais bien sur un enjeu de transparence et de partage ». Et de préconiser (préconisation n° 17) « d’intégrer l’Éducation nationale dans le domaine des secteurs d’activités industriels stratégiques soumis à une autorisation préalable du gouvernement français en cas d’investissements étrangers » .

L’État semble avoir pris la mesure du risque sur la protection des données d’éducation puisqu’à l’issue de ce rapport, le ministre Jean-Michel Blanquer a nommé en août 2018 Gilles Braun, un des coauteurs du rapport, comme délégué à la protection des données (DPD) au ministère de l’Éducation nationale, chargé de coordonner les travaux des DPD académiques et il a annoncé la création d’un comité d’éthique sur les données d’éducation à la rentrée scolaire 202090.

Si nous voulons répondre de façon pertinente à ces questions cruciales pour notre société, plusieurs axes s’imposent. Tout d’abord, appuyer de façon déterminée le développement d’une industrie française et européenne capable d’exister à côté des mastodontes aujourd’hui nord-américains et chinois91. Nous croyons que notre pays

peut relever ce défi pour plusieurs raisons, d’abord parce que le développement de logiciels éducatifs repose sur la créativité et la prise en compte d’un modèle culturel et que nous sommes donc bien placés (on peut faire l’analogie avec le jeu vidéo « à la française »). Ensuite parce que nous disposons de compétences reconnues dans les sciences de l’éducation d’une part et dans les sciences du numérique d’autre part. Enfin, parce que les enseignants sont généralement engagés pour la réussite de leurs élèves et sauront se mobiliser pour aider, en amont à la conception de bons systèmes, et en aval à leur validation sur le terrain. Quand, dans le passé, ces différents acteurs sont arrivés à travailler de concert, la réussite était au rendez- vous (§ Class’Code Annexe 3), gageons qu’elle le sera encore dans le futur !

89. https://www.ladocumentationfrancaise.fr/var/storage/rapports-publics/184000536.pdf

90. https://www.youtube.com/watch?v=ifFtCXVdMPk

91. L’intérêt des GAFAM pour l’éducation est bien connu mais on peut aussi regarder l’extraordinaire développement d’entreprises chinoises spécialisées comme Squirrel AI Learning.

Dans le document Éducation et numérique, Défis et enjeux (Page 79-83)