• Aucun résultat trouvé

Vers une recherche reproductible dans un cadre interdisciplinaire : enjeux et propositions pour le transfert du cadre conceptuel et la réplication des modèles

N/A
N/A
Protected

Academic year: 2021

Partager "Vers une recherche reproductible dans un cadre interdisciplinaire : enjeux et propositions pour le transfert du cadre conceptuel et la réplication des modèles"

Copied!
25
0
0

Texte intégral

(1)

HAL Id: hal-01677950

https://hal.archives-ouvertes.fr/hal-01677950

Submitted on 11 Jan 2019

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Vers une recherche reproductible dans un cadre

interdisciplinaire : enjeux et propositions pour le

transfert du cadre conceptuel et la réplication des

modèles

Sébastien Rey-Coyrehourcq, Robin Cura, Laure Nuninger, Julie Gravier,

Lucie Nahassia, Ryma Hachi

To cite this version:

Sébastien Rey-Coyrehourcq, Robin Cura, Laure Nuninger, Julie Gravier, Lucie Nahassia, et al.. Vers une recherche reproductible dans un cadre interdisciplinaire : enjeux et propositions pour le transfert du cadre conceptuel et la réplication des modèles. Sanders L. Peupler la terre. De la préhistoire à l’ère des métropoles, Presses universitaires François Rabelais, pp.409-434, 2017, Villes et Territoires, 978-2-86906-494-2. �hal-01677950�

(2)

Vers une recherche reproductible dans un cadre interdisciplinaire : enjeux et

propositions pour le transfert du cadre conceptuel et la réplication des

modèles

Laure Nuninger, Chrono-Environnement UMR 6249, MSHE C.N. Ledoux USR 3124, CNRS / Univ. Bourgogne Franche-Comté.

Sébastien Rey-Coyrehourcq, UMR 6266, Univ. de Rouen

Robin Cura, Géographie-cités UMR 8504, Univ. Paris 1 Panthéon-Sorbonne Julie Gravier, Géographie-cités UMR 8504, Univ. Paris 1 Panthéon-Sorbonne Lucie Nahassia, Géographie-cités UMR 8504, Univ. Paris 1 Panthéon-Sorbonne Ryma Hachi, Géographie-cités UMR 8504, Univ. Paris 1 Panthéon-Sorbonne Introduction

Les notions de reproductibilité et de repétabilité font aujourd’hui l’objet d’intenses débats qui touchent tous les cercles scientifiques. Que ce soit par le biais de revues d’autorité1, de blogs et

de carnets de recherche, ou plus généralement par les réseaux sociaux. Toute la sphère scientifique semble mobilisée pour identifier avec plus ou moins de certitudes2 les bons des

mauvais élèves dans ce domaine. À l’origine de ce mouvement, de récents et multiples scandales, qui semblent toucher les disciplines les unes après les autres3 4 5 6, révèlent des

pratiques peu scientifiques, dont on a soudain peur qu’elles soient, au moins dans certaines disciplines, devenues monnaies courantes78. Ce phénomène a incité les chercheurs à s’interroger

de façon plus fine sur ses causes mais aussi sur les moyens à mettre en œuvre pour observer et renverser cette tendance. Des initiatives collectives fortes, privées et publiques, se sont ainsi

1http://www.nature.com/news/reproducibility-1.17552

2 Se pose même la question de la réplicabilité des “études sur la réplicabilité”, comme en témoigne certains débats

animés et très récents autour de publications en psychologie (http://projects.iq.harvard.edu/psychology-replications/

et https://hardsci.wordpress.com/2016/03/03/evaluating-a-new-critique-of-the-reproducibility-project/), ou en économie (Camerer 2016, http://retractionwatch.com/2016/03/03/more-than-half-of-top-tier-economics-papers-are-replicable-study-finds/)

3 Begley CG, Ioannidis JPA, « Reproducibility in Science: Improving the Standard for Basic and Preclinical

Research », Circulation Research, 116(1), 2015, p. 116-126.

4 Ioannidis John, « Why most published research findings are false », 2005. [En ligne]

http://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.0020124

5 Baker Monya, « Over half of psychology studies fail reproducibility test », Nature, 2015. [Enligne]

http://www.nature.com/doifinder/10.1038/nature.2015.18248

6 Yong Ed, « Replication studies: Bad copy », Nature, 485(7398), 2012, p. 298-300. 7 Begley CG, Ioannidis JPA, « Reproducibility in Science... », op. cit.

8 Kaplan Robert M, Irvin Veronica L, « Likelihood of Null Effects of Large NHLBI Clinical Trials Has Increased

(3)

mises en place (Reproductibility Initiative9 par exemple sur Open Science Framework10). En

outre, cette situation a favorisé le retour à une réflexion plus générale sur les termes, les pratiques et les outils associés à la recherche scientifique. L’évolution des moyens techniques liés à cette prise de conscience a produit une véritable explosion du catalogue des solutions disponibles11.

Les travaux menés dans TransMonDyn ont permis d’établir un cadre conceptuel et une grille descriptive communs à l’ensemble des douze transitions étudiées (cf. chapitre 2), qui ont ensuite donné lieu à des réponses multiples en matière de modélisation (cf. chapitres de la partie 2). Au terme de ce travail, on doit s’interroger sur la validité des résultats obtenus tant en matière de « reproductibilité » au niveau des modèles proposés que du retour que l’on peut opérer sur le cadre conceptuel à partir des résultats obtenus. Les modèles ayant atteint des stades de développement variés, ce chapitre a pour objectif de poser les bases d’une réflexion globale illustrée par quelques exemples afin de contribuer au débat scientifique et public, sur les questions de reproductibilité et d’équifinalité, tel qu’il peut se poser dans un cadre interdisciplinaire. Dans l'espace de ce chapitre, nous avons fait le choix de nous concentrer uniquement sur le transfert du cadre conceptuel et des modèles de type Système Multi-Agents (SMA) afin d'apporter une vision à la fois théorique et pratique de la question de la reproductibilité scientifique.

Valider des méthodes et des résultats par leur reproductibilité : lesquels, pourquoi et comment ?

Introduction aux notions de répétabilité, reproductibilité et réplicabilité

Ces notions sont débattues depuis longtemps au sein de chaque discipline. Il n'y a pas une seule et unique vision théorique ou pratique de ces termes tant les objets d’études auxquels ils se rapportent sont susceptibles d’être différents. Les définitions les plus courantes de ces notions sont ancrées dans le vocabulaire de la métrologie et des sciences computationnelles12. Elles se

rapportent donc au contrôle d’un ensemble de mesures. Dans le cas de la répétabilité, il s’agit d’effectuer des mesures répétées sur un même objet ou des objets similaires dans des conditions spécifiques. Dans un contexte de reproductibilité, ces mesures sont réalisées avec des instruments différents et dans des conditions variables (lieu, opérateur) qui doivent alors être spécifiées. La réplicabilité a été étudiée dans le domaine de l’informatique et désigne la capacité à reproduire à l’identique, les résultats d’une analyse13.

9http://validation.scienceexchange.com/ 10https://osf.io/

11 Telles que ROpenSci (https://ropensci.org/), Dataverse (http://dataverse.org/), Zenodo (http://zenodo.org/)

12 « Au sens le plus général, une science computationnelle est une science qui utilise l’ordinateur comme une

machine à modéliser et à simuler au moyen de computations. » (Varenne, 2010)

(4)

La question de la reproductibilité en SHS

Les définitions données ci-dessus sont essentiellement centrées sur la mesure ou le calcul dans un environnement informatique et non pas sur l’évaluation d’un raisonnement construit à partir d’un corpus de données collectées de façon souvent hétérogène. En SHS, les bases de données sont le plus souvent élaborées à partir de données collectées par enquête ou investigation de terrain. Même si des protocoles rigoureux sont établis, les « mesures » dépendent largement de l’expertise d’une personne et non pas du capteur d’une machine, exception faite de la télédétection. En outre, elles dépendent totalement du terrain et sont donc par définition opérées dans des conditions variables excluant d’emblée le principe strict de répétabilité. Il existe toutefois des voies pour approcher la reproductibilité aussi en sciences humaines.

En archéologie, par exemple, comme dans d’autres sciences humaines, ces questions animent la recherche depuis plus d’un demi-siècle à propos de la collecte des données et donc de l’enregistrement des informations archéologiques. Cet enregistrement permet de « mesurer » des faits tels que la taille d’une série d’objets, la densité d’objets découverts en un lieu donné ou encore la distance qui sépare des objets de même type. Selon le mode d’investigation, des protocoles ont pu être spécifiés pour assurer une collecte dans les conditions les plus homogènes possibles ou tout au moins suffisamment bien décrites pour tenter de pondérer les mesures effectuées ensuite14 15 16. Pour l’étude du système de peuplement, c’est ce type d’approche qui a

permis d’établir des comparaisons entre plusieurs zones d’études17 18 19. La mesure n’est

néanmoins ni directe, ni effectuée par des instruments de mesure spécifiques, mais par des « capteurs » humains dont la « calibration » est de fait difficile à maîtriser. Avant la mesure proprement dite, un premier acte subjectif va consister à identifier un objet archéologique pour le collecter et un second acte reposera sur la mise en relation de cet objet avec d’autres pour définir une mesure, par exemple une densité d’objets en un lieu donné. Admettons qu’une même

14 Raynaud Claude, « Archéologie du paysage autour de l’Etang de l’Or (Hérault), choix, contraintes et méthode de

prospection », Archéologie en languedoc, 2(3), 1989, p. 59-83.

15 Trément Frédéric, Archéologie d’un paysage, les étangs de Saint-Blaise (Bouche du Rhône), Maison des Sciences

de l’Homme, Paris, 1999

16 Nouvel Pierre, « La prospection terrestre, Méthodes et objectifs », ArchéoThéma, 2012, p. 28-29.

17 Leeuw (van der) Sander Ernst, Favory François, Fiches Jean-Luc, Archéologie et systèmes

socio-environnementaux: études multiscalaires sur la vallée du Rhône dans le programme Archaeomedes, 27, Paris,

CNRS Editions, 2003

18 Bertoncello Frédérique, Fovet Élise, Tannier Cécile, Gandini Cristina, Lautier Laurence, Nouvel Pierre, Nuninger

Laure, « Configurations spatiales et hiérarchiques du peuplement antique: des indicateurs quantitatifs pour une confrontation interrégionale. », dans Variabilités, Environnementales, Mutations Sociales : Nature, intensités,

échelles et temporalités des changements, éd. par F. Bertoncello, F. Braemer, Antibes, France, APDCA, 2012, p.

175-190.

19 Nuninger Laure, Bertoncello Frédérique, Favory François, Fiches Luc, Raynaud Claude, Girardot

Jean-Jacques, Sanders Lena, Mathian Hélène, « Peuplement et territoire dans la longue durée : retour sur 25 ans d’expérience », dans L’archéologie en mouvement : hommes, objets et temporalités - 23-25 juin 2010, éd. par S. Archambault De Beaune, H.-P. Francfort, Paris, CNRS éditions Alpha, 2012, p. 152-159.

(5)

personne retourne plusieurs fois sur le terrain pour vérifier ses découvertes et son calcul de densité d’objets – ce qui est effectivement régulièrement pratiqué – un premier pas est fait vers un cadre de répétabilité. Cependant, les conditions peuvent être modifiées sans que l’on puisse nécessairement savoir quels paramètres ont pu varier et quel rôle le processus taphonomique20 a

pu jouer sur les objets observés ou absents des observations. C’est en fait la somme des connaissances accumulées qui permet d’obtenir un consensus acceptable sur le phénomène étudié et qui permet notamment de partir du principe qu’un site archéologique constitue la donnée de base pour étudier le système de peuplement (cf. ci-après).

Reproduire des mesures ou un raisonnement ?

La mise en relation des « sites » archéologiques qui vont composer le système étudié implique des hypothèses qui ne reposent pas uniquement sur l’observation archéologique mais sur des théories issues d’autres disciplines21. En effet, l’archéologie est fondée sur l’étude des traces

matérielles et toutes les relations humaines n’en laissent pas nécessairement, ce qui ne préjuge pas de leur existence. Il y a ainsi dans la mise en relation de « sites » archéologiques une part importante d’interprétation fondée sur un raisonnement impliquant d’autres connaissances que les seules traces matérielles. On pourra par exemple mobiliser le modèle gravitaire pour estimer la valeur d’un flux entre deux lieux pour des périodes anciennes à partir des seules traces matérielles laissées sur chacun des lieux. Cet exemple montre que la reproductibilité ou répétabilité d’un résultat ne dépend pas uniquement d’une « mesure » mais également d’un raisonnement. Cette situation n’oppose pas uniquement passé et présent puisqu’elle est valable sur d’autres aspects en sciences sociales pour lesquels la mesure n’est pas une observation tangible, comme dans le cas du« sentiment d’appartenance » ou de « bien-être » par exemple. Dans la mesure où le raisonnement et les hypothèses issues du domaine étudié sont choisis, formalisés et organisés en vue de « faciliter »22 un questionnement au travers du « laboratoire

virtuel » que représente la simulation, les concepts de réplicabilité, reproductibilité et répétabilité sont opérants pour la mise en œuvre du modèle.

Vers la question de l’équifinalité

Le critère de démarcation Poppérien de la réfutation est une idée forte qui a marqué la communauté scientifique dans ses pratiques, y compris en modélisation en science humaine23. 20 Phénomènes naturels ou anthropiques intervenant à la suite du dépôt initial d’un objet, d’un sédiment et

impliquant sa décomposition, destruction ou fossilisation.

21 Favory François, Nuninger Laure, Sanders Lena, « Intégration de concepts de géographie et d’archéologie spatiale

pour l’étude des systèmes de peuplement », L’Espace géographique, (4), 2012, p. 295-309.

22 Varenne Franck, « Epistémologie des modèles et des simulations: tour d’horizon et tendances », Physique et

interrogations fondamentales, 11, 2008.

23 Le concept de réfutabilité (ou « falsifiability ») a été développé dans les années 30 en particulier par Karl Popper

(6)

Toutefois il faut rappeler que son application s’est construite avant tout dans un cadre de démonstration logique, dont on a démontré depuis longtemps les nombreuses faiblesses24 25. En

soi cela ne poserait pas de problème si ce cadre n’était pas encore avancé dans la littérature pour séparer « science » et « non science ». Suivant ce schéma, il serait tentant de considérer les sciences humaines comme incapables de formuler des cadres théoriques révisables et durables. Pour Jean-Claude Passeron26 27, les SHS construisent les connaissances d’une toute autre façon

que les sciences physiques, assumant d’autres types de scientificité. Tout en acceptant cette spécificité de construction des connaissances propre aux sciences humaines, Denise Pumain28

suggérant de penser une construction des connaissances à la fois cumulative29 et riche des

apports fructueux qu’apporte la diversité des points de vue disciplinaires au sein des sciences sociales.

Dans une analyse de plusieurs travaux de géographes et d’archéologues faisant référence à la loi de Zipf30 pour étudier l’organisation hiérarchique des systèmes de peuplement, Lena Sanders

montre ainsi l’intérêt d’adopter une approche combinant plusieurs points de vue31. La

comparaison des résultats obtenus suggère qu’une approche à différents niveaux d’abstraction permet une interprétation plus subtile qu’à un seul niveau, le plus universel soit-il et que les différentes pratiques disciplinaires favorisent une diversification des approches qui permet de mieux expliquer la récurrence d'une loi rang taille dans l’organisation d’un système de peuplement.

expérience permet précisément de contredire cette affirmation initiale. La réfutabilité permet de démarquer les théories scientifiques et les théories les plus réfutables sont celles qu’il faut privilégier. Tenter de réfuter un jeu d'hypothèses pour produire un résultat attendu dans un modèle de simulation demeure dans de nombreux domaines plus pertinent pour leurs auteurs qu'une accumulation de résultats positifs.

24 Chalmers Alan F, Qu’est-ce que la science ?, Paris, La Découverte, 1987

25 Chez les géographes : Besse Jean-Marc, « Problèmes épistémologiques de l’explication », colloque Géopoint,

« L’explication en géographie », Groupe Dupont, Université d’Avignon, 2000, p. 11-18.

26 Passeron Jean-Claude, Le Raisonnement sociologique: Un espace non poppérien de l’argumentation, Paris, Albin

Michel, 2006

27 Pumain Denise, « Cumulativité des connaissances », Revue européenne des sciences sociales. European Journal

of Social Sciences, XLIII(131), 2005, p. 5-12.

28 Pumain, D., « Cumulativité des connaissances », op.cit.

29 Denise Pumain fait référence à cette définition de Berthelot : « Par cumulativité, on entend classiquement la

possibilité d’intégrer les résultats d’un grand nombre d’observations et d’expériences dans l’unité d’un modèle susceptible de les déduire » (Berthelot 1996).

30 Zipf George Kingsley, Human behavior and the principle of least effort, Cambridge, England, Addinson-Wesley

Press, 1949

31 Sanders Lena, « Regards Scientifiques Croisés Sur La Hiérarchie Des Systèmes De Peuplement: De L’Empirie

(7)

Il est donc possible de travailler à la mise en place de méthodes permettant de consolider la construction d’un savoir, qui ne sacrifie si possible ni l’originalité, ni la diversité des points de vue engagés. Selon Denise Pumain32 :

Nous pourrions ainsi, tout en produisant des formalismes nouveaux, illustrer la question de la complexité d’une façon bien plus éclairante [...]. La complexité d’une notion serait mesurée par la diversité des regards disciplinaires nécessaires à son élaboration, à l’intelligibilité des objets ou des processus étudiés, selon un objectif donné de précision des énoncés et des contextes.

Prendre en compte des perspectives variées a été un choix délibéré du collectif TransMonDyn. Cette diversité tant dans les démarches que dans les formalismes a été une richesse. Outre le résultat de chaque modèle proprement dit, il est important de souligner son rôle de médiateur entre thématiciens et modélisateurs pour produire un retour constructif sur l’outil conceptuel commun. Si chaque modèle développé a pu apporter des connaissances spécifiques sur chacun des cas d’étude, il a aussi contribué à confronter et cumuler des connaissances et des expériences. Le recours aux modèles de simulation a notamment permis de mettre en place de véritables « laboratoires virtuels » autorisant le développement et la confrontation d’hypothèses sous une forme dynamique, spatiale et temporelle.

Un point critique est relatif à la propriété d’équifinalité. Si sa définition est de nature biologique33, cette notion est également employée par des géographes34 et des archéologues35.

Elle désigne de façon générale la possibilité d’obtenir, pour un système ouvert, un état final identique en suivant des trajectoires et des conditions initiales différenciées. Cela signifie dans le cas d’un modèle de simulation que des jeux d’hypothèses ou de paramètres différents peuvent mener à des résultats identiques. L’équifinalité souligne la prudence à observer lors de la modélisation d’un phénomène particulier. En revanche, dans un contexte d’analyse comparative, un constat d’équifinalité peut être un atout pour prendre un recul critique relativement aux objets conceptualisés et implémentés (les villes par exemples, sont représentés différemment par les archéologues et les géographes). Un tel recul permet d’identifier les intérêts respectifs des différentes approches et éventuellement de combiner les points de vue. Dans une telle démarche, le modèle devient un véritable outil de médiation permettant à chacun d’exposer son point de vue dans un cadre intelligible par tous, car idéalement transparent et non bruité par le bagage disciplinaire propre à chacun.

32 Pumain, D., « Cumulativité des connaissances », op.cit.

33 Ludwig Von Bertalanffy en 1949 « [...] qualifia d’“équifinalité”, [...] la capacité de l’embryon à atteindre un même

état final de développement quelles que soient les conditions initiales et les modalités intermédiaires particulières de son développement. » (Pouvreau, 2013)

34 O’Sullivan David, « Complexity science and human geography », Transactions of the Institute of British

Geographers, 29(3), 2004, p. 282-295.

35 Premo LS, « Equifinality and explanation: the role of agent-based modeling in postpositivist archaeology »,

Simulating Change: Archaeology into the Twenty-First Century. University of Utah Press, Salt Lake City, 2010, p.

(8)

Les modèles doivent pouvoir être échangés, partagés, discutés, avec cette idée sous-jacente que seul un modèle qui se rapproche de l’idéal de transparence permet d’enclencher une discussion sur des bases honnêtes. Nous partons en effet du principe que même un « mauvais modèle » qui ne permettrait pas de reproduire une situation observée et/ou de vérifier une théorie initiale, demeure porteur d’informations intéressantes pour affiner la construction de nos raisonnements en sciences humaines. Il devient de notre point de vue un « bon modèle », si son contenu permet d’appréhender le raisonnement logique qui conduit au résultat observé et de le reproduire. Quid du problème des données

Si l’on se place dans un cadre de reproductibilité telle que définie par les sciences computationnelles, les données mobilisées en SHS peuvent rapidement devenir un obstacle, en particulier pour les périodes les plus anciennes. En effet, chaque cas d’étude est non seulement fondé sur un jeu de données le plus souvent hétérogène et dépendant des conditions d’investigation, mais dès lors que l’on s’intéresse à la très longue durée des sociétés nous sommes face à des écarts importants, tant quantitatifs que qualitatifs, entre les différents cas d’étude. Aussi, par exemple, le simple fait de vouloir identifier un changement potentiel de régime dans le système de peuplement repose sur des approches extrêmement variables qui vont de l’observation d’un fait statistique établi sur un jeu de données conséquent à un postulat théorique reposant sur de rares données (cf. chapitre 2). Certains paramètres reposent ainsi sur de pures hypothèses théoriques reconstruites à partir d’analogies et bâties à partir de quelques données. Il convient donc de préciser autant que possible le niveau d’incertitude attaché aux données, précision d’autant plus nécessaire que le contexte est interdisciplinaire. De même, l’explicitation du mode de construction des entités mobilisés dans le modèle et de leurs relations est également cruciale dans un cadre interdisciplinaire. Des outils comme le cadre conceptuel commun et les diagrammes sagittaux permettent d’élaborer cette méta-information (cet historique de construction du modèle) sous la forme d’un cheminement. Cette méta-information facilite la transmission du travail effectué ainsi que son évaluation.

Dans cette perspective, nous pouvons préciser comment peut s’opérer la comparaison de processus de transition a priori similaires, dans des contextes éco-culturels extrêmement différents. En effet, ce ne sont pas tant les données initiales ou la validité des résultats obtenus pour expliquer un phénomène de transition qui importe, que l’évaluation croisée du raisonnement, ses forces et ses faiblesses, menée à partir de chaque cas d’étude pour mieux comprendre et interpréter un mécanisme. Nous pensons, en effet, qu’une évaluation croisée permettrait de distinguer les facteurs fondamentaux des facteurs contextuels mis en œuvre dans le processus de transition. On éviterait ainsi deux écueils, celui de l’ultra-simplification dans un modèle universel qui aurait tendance à appauvrir l’interprétation et celui de l’ultra-spécification dans un modèle ad hoc qui n’autoriserait pas la comparaison et la possibilité d’appréhender des phénomènes globaux. Le temps imparti au projet TransMonDyn n’a pas permis de comparer

(9)

dans leur globalité l’ensemble des cheminements de construction des différents modèles, mais des pistes solides ont pu être définies et nous en présentons deux dans la suite, l’un sur le transfert du cadre conceptuel et l’autre sur des points méthodologique et technique.

Transférer le cadre conceptuel de TransMonDyn à d'autres contextes spatio-temporels Le collectif TransMonDyn s’est attaché à aborder la question des transitions dans le système de peuplement à partir de 12 cas d’études, aux échelles chronologiques et spatiales extrêmement variées mais à l’aide d’un cadre conceptuel commun, défini collectivement. Ce cadre repose sur une approche à la fois systémique et ontologique qui permet de caractériser deux régimes de peuplement distincts (cf. chapitre 2, figure 4). L’identification de différences entre les deux systèmes (Régimes 1 et 2) permet de repérer l’existence d’une transition qui est ensuite décrite de façon harmonisée selon cinq dimensions complémentaires (cf. chapitre 2, figure 5):

(a) mode d’habiter, occupation de l’espace, (b) déplacement, transport, formes de mobilités, (c) manière de se nourrir, rapport à l’environnement, (d) fonctionnement social, forme de socialité,

(e) formes de pouvoir, administration, maillage.

Si cette démarche du collectif TransMonDyn a permis d’établir un langage commun pour la description des transitions, il reste à vérifier si ce cadre conceptuel est opérant dans d’autres contextes, autrement dit si le raisonnement est reproductible sur d’autres cas d’étude. C’est dans cet objectif que nous avons testé le transfert du cadre conceptuel sur des systèmes de peuplement relatifs à l’espace intra-urbain, et donc sur d’autres types d’espaces que ceux étudiés au sein du projet TransMonDyn (échelle régionale à mondiale). Les cas d’étude sont tirés de trois travaux de thèse en cours répondant à des problématiques différentes (tableau 1), ce qui permettra de tester l’intérêt du cadre conceptuel dans des contextes variés.

Cas d’étude Problématique

Beauvais : du XIX au XXe siècle Comment la morphologie du réseau de rues évolue-t-elle ? Comment caractériser ses changements grâce à la théorie des graphes ?

Noyon : l’espace urbain sur toute la durée de son existence (Ier-XXIe siècle)

Quels sont les changements fonctionnels et spatiaux de l’espace intra-urbain de Noyon sur le temps long ? Comment confronter les observations qualitatives et quantitatives ?

Tours : l’espace urbain sur toute la durée de son existence (Ier-XXIe siècle)

À quelle(s) logique(s) spatiale(s) la localisation des activités répond-elle sur le temps long (centre/périphérie, voisinage, etc.) ?

(10)

Tableau 1 : Les trois cas d’étude utilisés pour tester la reproductibilité du cadre conceptuel. Élaboration d’une démarche pour le transfert du cadre conceptuel

De manière générale, notre démarche est fondée sur deux étapes principales qui sont articulées autour d’une hypothèse sur l’existence d’une transition dans un système de peuplement (figure 1). En premier lieu, un changement fort dans la structure spatiale intra-urbaine est idenfié à partir de connaissances expertes et de données formalisées. Nous faisons ensuite l’hypothèse que ce changement correspond à une transition dans le système de peuplement. Enfin cette hypothèse est testée au moyen d’un protocole mis en place spécifiquement pour cette démarche. Celui-ci prend appui sur la grille de description des régime/transition qui est composée des cinq dimensions (notées de (a) à (e) plus haut) mobilisées au sein du projet. Chacune des dimensions est testée par connaissances expertes ou par les données, et trois résultats sont possibles : (1) on constate un changement dans la dimension considérée, (2) on ne constate pas de changement, (3) on ne peut pas se prononcer en raison d’un manque de données et de connaissances expertes sur la dimension concernée. Nous avons choisi de rejeter l’hypothèse de l’existence d’une transition si moins de trois dimensions connaissent des changements et/ou si plus d’une dimension n’en comprend pas.

Ce mode de validation utilise de manière rigoureuse la grille de description d’une transition, avec ses cinq dimensions, ce qui permet de rendre comparable les résultats obtenus sur les trois cas d’étude.

(11)

Figure 1 : Schéma général de la démarche du transfert du cadre conceptuel. Application aux trois cas d’étude intra-urbain : Beauvais, Noyon et Tours

L’application de la démarche proposée aux trois cas d’étude est présentée dans la figure 2.

Les items représentés sur fond gris sur la figure 2 renvoient, en la détaillant, à la logique générale de la démarche présentée dans la figure 1. Les étapes d’identification d’un changement, d’hypothèse d’existence d’une transition et de test de cette hypothèse y sont complétées par des éléments spécifiques au contexte d’application : les cas d’étude et les données. Les processus qui relient ces items sont figurés par des flèches pleines : la construction et l’exploration des changements, les différents tests de l’hypothèse. Enfin les questionnements qui résultent du transfert du cadre conceptuel sont représentés par des flèches pointillées sous forme de boucle de rétroaction. Bien que cette démarche obéisse à un principe général commun, chacune des trois expériences suit un parcours spécifique. Il est possible de suivre la trajectoire de chacune d’elles grâce aux couleurs attribuées à chaque cas d’étude dans le schéma.

(12)

Figure 2 : Schéma d’application du cadre conceptuel à trois cas d’étude intra-urbains : Beauvais, Noyon et Tours.

(13)

Pour chaque cas d’étude, l’exploration de données de nature diverse permet d’identifier un ou plusieurs changements forts dans la structure spatiale du système de peuplement considéré. Dans le cas de Tours, un changement important est par exemple identifié entre 400 et 600, période à partir de laquelle se développe un deuxième centre urbain lié au culte de saint Martin à quelques kilomètres de la ville existante. La mise en place de cette bipolarité, bien connue historiquement, est validée par l’exploration de la base de données mobilisée dans la thèse, constituée d’objets (bâtiments, rues…) localisés dans l’espace et situés dans le temps. À partir de l’année 400 on identifie effectivement l’apparition d’un agrégat de points, correspondant à des bâtiments religieux, qui s’intensifie peu à peu à l’ouest de l’enceinte de la cité. Il s’agit alors de tester l’hypothèse selon laquelle ce changement de la structure spatiale de la ville peut être interprété comme une transition dans le système de peuplement. Dans les cas de Noyon et de Beauvais des changements sont également repérés et c’est l’exploration statistique des données et des indices remarquables (comparaison d’indices morphologiques, de graphes, de statistiques multidimensionnelles…) qui permet de mettre en évidence des changements qui constituent ainsi des « candidats » pour lesquels nous posons l’hypothèse qu’ils correspondent à des transitions. Pour Beauvais et Tours, parmi tous les changements importants pouvant potentiellement se produire au cours de l’existence du système, un seul changement susceptible d’être interprété comme une transition est identifié et soumis au test. Pour Noyon, en revanche, c’est l’ensemble des changements identifiés sur toute la durée de l’existence de la ville qui sont considérés comme de potentiels candidats à une interprétation en termes de transition.

Une fois l’hypothèse posée, elle est soumise au test décrit précédemment (figure 1), qui consiste à vérifier si les cinq dimensions qui composent la grille de description connaissent un changement entre les deux bornes de la supposée transition.

Nous développons ici un exemple de la procédure de validation de l’hypothèse d’existence d’une transition en nous appuyant sur le cas de Beauvais. Une première tentative de test a révélé qu’entre les supposés Régime 1 (avant la Seconde Guerre mondiale) et Régime 2 (après la reconstruction en 1960), seules les deux premières dimensions ((a) mode d’habiter et (b) déplacements) ont partiellement changé (construction d’habitations plus grandes, reconfiguration des îlots et du réseau de rues). Si l’on se concentre sur les autres dimensions, force est de constater que le changement s’est opéré bien avant la Seconde Guerre mondiale. En effet, l’industrialisation tardive de Beauvais dans la seconde moitié du XIXe siècle a entraîné un ensemble de mutations majeures, notamment dans les modes de déplacement (abandon de la diligence en 1876 avec l’ouverture d’une ligne ferroviaire directe vers Paris), dans les modes d’exploitation du sol et dans les formes de sociabilité (délaissement de l’activité artisanale et développement de manufactures). Ces constats spécifiques au cas d’étude nous ont permis d’invalider l’hypothèse initiale de transition pour la période considérée a priori et de redéfinir les bornes temporelles choisies, en situant le Régime 1 dans la période qui précède l’industrialisation de la ville (première moitié du XIXe siècle). La transition se retrouve ainsi étendue sur une

(14)

période plus longue (entre la deuxième moitié du XIXe et 1960) et s’avère cette fois-ci vérifiée pour au moins quatre des cinq dimensions de la grille (la dimension (e) formes de pouvoir, administration et maillage ne pouvant être validée, faute de connaissances expertes). En ce sens pour le cas de Beauvais, le protocole de validation de l’existence d’une transition a été itéré. Confrontation des résultats des trois expériences

Le test associé au transfert du cadre conceptuel TransMonDyn aux trois systèmes intra-urbains fait apparaître deux résultats majeurs. Les retours spécifiques aux cas, illustrés par des flèches de rétroaction pointillées dans la figure 2, interviennent sur des domaines variés tels que le cas d’étude, la construction ou l’exploration des données.

Concernant Beauvais, la validation de l’hypothèse d’existence d’une transition est infructueuse dans un premier temps, mais le réajustement temporel des bornes temporelles de la transition a permis de refaire le test et de valider l’hypothèse. Ce retour sur l’hypothèse initiale a permis un retour intéressant sur le cas d’étude et, in fine, sur la problématique de départ (tableau 1). En effet, le transfert du cadre conceptuel a permis de révéler à Beauvais un phénomène d’hystéréchronie dans le réseau de rues : ce dernier, de par sa matérialité, a longtemps résisté au changement du système de peuplement et sa transformation ne s’est faite qu’après les destructions massives de la Seconde Guerre mondiale (soit près d’un siècle après le début de l’industrialisation de la ville).

Dans le cas de Tours, l’hypothèse de l’existence d’une transition entre 400 et 600 est validée, ce qui implique une caractérisation plus précise de ce moment de changement dans le système de peuplement. En revanche, il faut mettre en regard ce résultat avec la problématique liée au cas d’étude (cf. tableau 1) qui interroge spécifiquement les logiques de localisation des activités dans l’espace intra-urbain. Il s’agit donc de voir si la transition validée à l’échelle du système de peuplement intra-urbain concorde avec des changements dans ces logiques de localisation (des activités qui se localiseraient préférentiellement en périphérie alors qu’on les trouvait auparavant au centre-ville, par exemple). De fait, on constate que ce n’est pas le cas, même en considérant une fenêtre temporelle élargie : l’implantation de la tombe de saint Martin, à l’origine du développement du second centre, correspond par exemple toujours à la logique antérieure antique de localisation des nécropoles, à proximité mais en dehors des villes. Une transition de la structure spatiale du système de peuplement peut donc émerger sans que les principes de localisation des activités urbaines, reflet du fonctionnement de la ville, ne connaisse de changement majeur.

Dans les deux cas de Beauvais et Tours, l’exercice a donc permis de préciser le lien entre le système de peuplement et les objets spécifiquement interrogés par la problématique de recherche (la morphologie du réseau de rue / les logiques de localisation des activités) en questionnant notamment les différences de temporalité existant entre les deux.

Pour le cas de Noyon, le test sur l’existence d’une transition a été effectué à trois moments de changement du système intra-urbain (début du VIIe siècle, XIIe siècle et fin du XVIIIe siècle).

(15)

Pour les deux premiers, l’existence d’une transition a été validée. L’application du cadre conceptuel de TransMonDyn a permis de préciser les dimensions socio-spatiales des changements particuliers à la ville et ce faisant, de mettre en évidence des temporalités a priori peu visibles. Une première interprétation des données menait ainsi à décrire des changements sous forme de ruptures spatiales et fonctionnelles correspondant à des changements rapides dans le système intra-urbain. Or l’application systématique des cinq dimensions du cadre conceptuel suggère au contraire que ces changements sont des transitions dans le système, caractérisées par des durées relativement longues. L’application du cadre conceptuel de TransMonDyn a donc entraîné une redéfinition de l’interprétation des rythmes du changement de la ville. Pour le troisième moment de changement repéré à la fin du XVIIIe siècle, l’hypothèse d’un changement sous forme de transition n’est pas validée. Trois facteurs peuvent être à l’origine de ce rejet de l’hypothèse de transition : (1) la grille d’analyse des données retranscrirait mal les évolutions urbaines récentes (étalement urbain, spécialisation fonctionnelle croissante des quartiers, etc.) car elle a avant tout été élaborée pour des périodes anciennes – de l’Antiquité à la fin de l’époque moderne environ, le changement repéré serait alors un effet de sources ; (2) l’exploration des données n’est pas suffisante pour repérer des transitions car les méthodes utilisées (observation de cartes de différentes périodes et analyses factorielles sur l’ensemble de toutes les périodes) font ressortir des changements qui n’affectent pas nécessairement le système de peuplement. Ce dernier peut en effet continuer à se reproduire dans ses mêmes structures, au sein d’un même régime, alors que des changements profonds ont affecté la ville d’un point de vue politique ou religieux; (3) rejet de l’hypothèse d’existence d’une transition pour les dimensions (b) déplacement, transport, forme de mobilité et (c) manière de se nourrir, rapport à l’environnement qui ne répondent pas à l’hypothèse.

Au-delà des résultats propres à chacun des travaux de recherche, le transfert du cadre conceptuel de TransMonDyn est opérant dans tous les cas. Il apparaît donc que le concept de transition tel qu’il est conceptualisé et modélisé dans le projet collectif est reproductible. Surtout, ce transfert est possible à une autre échelle géographique que celles prises en compte dans TransMonDyn. En matière de reproductibilité, il faut souligner que l’application du cadre conceptuel nécessite une connaissance très pointue de l’objet d’étude dans tous les domaines que couvrent les cinq dimensions de la grille. Cependant, l’expérience menée montre qu’elle est pleinement fructueuse dans une perspective comparative et peut ainsi prendre tout son sens pour mener un travail collectif interdisciplinaire.

Moyens pour une bonne reproductibilité des modèles Mise en place d’une démarche de reproductibilité

(16)

Comme nous l’avons vu, le cadre conceptuel défini pour caractériser une transition semble opérant pour d’autres contextes et d’autres échelles que ceux étudiés dans le programme TransMonDyn. Si la plupart des 12 cas d’étude ont fait l’objet d’une modélisation spécifique, le choix des formalismes et des modes d’implémentation est resté extrêmement ouvert et la perspective comparative est restée au cœur du questionnement collectif. C’est dans cet esprit que nous proposons des pistes de réflexion dans ce chapitre.

Reproductibilité, libre-accès et simulation en théorie

Après avoir abordé la question de la reproductibilité/réplicabilité de manière générale dans les sciences soaciles, il est nécessaire de voir quelles significations prennent ces termes lorsqu’on les met concrètement en œuvre dans la construction et l’expérimentation des modèles de simulation développés. D’emblée une question se pose : la reproduction technique est-elle un préalable nécessaire à la reproductibilité d’un modèle ? Ian P. Gent dans son « recomputation manifesto »36, l’affirme pour les sciences informatiques : celles-ci se distinguent par leur capacité à

reproduire ou répliquer l’exécution et le comportement attendu d’un code source37. La mise en

œuvre et les objectifs des modèles sont généralement différents en SHS comme nous l’avons vu plus haut. En pratique – même si l’on sait que les deux sont intrinsèquement liées – il conviendrait donc de dissocier la partie « moteur » du modèle de simulation (qui relève de l’informatique) de la partie « thématique ».

L’aspect dit « moteur » repose sur un « code source » qui doit en tout état de cause satisfaire aux critères de réplicabilité des sciences computationnelles. Dans le code source on trouve les informations sur la façon dont sont organisées et appelées les règles du modèle. Les méthodes d’exploration (avec leurs enchainements) des scénarios sont également décrites sous la forme d’un code source accompagnant les modèles. Pour l’aspect dit « thématique », c’est l’exploration même du modèle dans une perspective d’interprétation de différentes variantes qui est mise en avant car elle permet d’enrichir le raisonnement du thématicien en particulier là où il n’a pas ou peu de données observables (cf. chapitre 3).

Cette exploration thématique peut également être formalisée sur un plan informatique (sous forme de « codes-sources »), pour effectuer des analyses de sensibilités ou évaluer l’impact de l’ordonnancement des règles. Si ces matériaux ne sont pas rendus disponibles par les modélisateurs, les résultats associés aux aspects « thématiques » demeurent purement hypothétiques car il est alors impossible de vérifier leur contenant38 ou de les rejouer

précisément. Les "codes sources" sont donc porteurs des raisonnements émis tout au long du processus de modélisation, autant sur les aspects "thématiques" que "moteurs". Du fait de

36 Gent Ian P, « The recomputation manifesto », arXivpreprint, 2013. [En ligne] http://arxiv.org/pdf/1304.3674 37 Le code source est l'ensemble des règles et des fonctions qui induisent le fonctionnement d'un programme

informatique.

38 Par « contenant », on entend ici désigner la description informatique de ces matériaux au sein d’un code source.

Par exemple dans une simulation, le « contenant » à vérifier est le code source qui décrit les différentes variantes, et scénarios. Ce code source reflète donc les choix thématiques opérés par les modélisateurs.

(17)

l’intrication entre le développement du raisonnement et le substrat informatique utilisé, la question de la reproductibilité se pose à l’échelle du raisonnement.

Au-delà de la simple vérification informatique qu’elle permet lorsque les créateurs donnent à voir le code source du modèle, la pratique de la réplication implique donc une réévaluation critique du raisonnement sous-jacent ayant produit la construction et l’exploration du modèle de simulation39, ainsi qu’une analyse des choix et abandons successifs y ayant mené40. Depuis

presque 20 ans, et malgré les efforts fournis par différents acteurs de la communauté des SMA, cette démarche peine à se généraliser. Dans la pratique, il est souvent difficile d’accéder aux informations nécessaires : selon une enquête41 portant sur l’ensemble des publications relatives à

la modélisation agent en SHS en 2008, la mise à disposition des codes sources des modèles est encore inférieure à 20%. Une étude42 portant sur l’ensemble des matériaux scientifiques

accompagnant les publications dans le journal JASSS43 entre 2001 et 2012 (schéma, tableau,

équations, code source etc.), constatent l’anarchie régnante et soulignent l’urgence qu’il y a à clarifier les pratiques associées aux publications de modèles.

L’enjeu des sections qui suivent est d’une part de montrer comment la réplicabilité peut être mise en œuvre de façon graduelle à l’aide de différentes solutions techniques et d’autre part d’illustrer par un exemple comment cette démarche sert à construire un espace de discussion collective.

La réplicabilité du code et l’exécution d’un modèle

La mise en œuvre de modèles réplicables, première étape vers une recherche reproductible, n’est pas une chose aisée. Nous proposons (figure 3) d’identifier plusieurs étapes menant progressivement à la réalisation de cet objectif. Deux objets sont à prendre en compte de façon simultanée dans cette progression, d’une part le modèle de simulation (A), et d’autre part l’exploration (B) associée à ce modèle. Aujourd’hui toutes les techniques pour la mise en œuvre d’une telle progression existent. En effet, tout comme l’apparition de la plate-forme de modélisation NetLogo en SHS a facilité l’indépendance des chercheurs en matière de

39 Wilensky Uri, Rand William, « Making Models Match: Replicating an Agent-Based Model », Journal of

Artificial Societies and Social Simulation, 10(4), 2007, p. 2.

40 Voir Banos Arnaud, « Pour des pratiques de modélisation et de simulation libérées en Géographie et SHS »,

Habilitation à Diriger des Recherches, Université Paris 1 Panthéon-Sorbonne, 107 p, 2013, et Rey-Coyrehourcq Sébastien, « Une plateforme intégrée pour la construction et l’évaluation de modèles de simulation en géographie », Thèse de doctorat en Géographie, Université Paris I - Panthéon-Sorbonne, 2015

41 Heath Brian, Hill Raymond, Ciarallo Frank, « A survey of agent-based modeling practices (January 1998 to July

2008) », Journal of Artificial Societies and Social Simulation, 12(4), 2009, p. 9.

42 Angus Simon D, Hassani-MahmooeiBehrooz, « “Anarchy” Reigns: A Quantitative Analysis of Agent-Based

Modelling Publication Practices in JASSS, 2001-2012 », Journal of Artificial Societies and Social Simulation, 18(4), 2015, p. 16.

(18)

modélisation, des efforts sont faits aujourd’hui pour rendre accessibles ces techniques autrefois réservées aux seuls informaticiens.

(Fig. 3)

Figure 3 : Les paliers de réplicabilité d’un modèle de simulation et de son exploration. Chaque palier (de haut en bas) permet d’avancer dans la démarche de reproductibilité.

En premier lieu, les étapes de partage du contenu du modèle (paliers A.1 à A.5) sont facilitées par des plates-formes ouvertes de dissémination de modèles. C’est le cas par exemple du site internet de partage de modèle NetLogo « Modelling Commons »44, qui permet d'exécuter le modèle

directement en ligne ou de le télécharger pour l'exécuter localement (A.4.). L’utilisateur peut accéder au code source et à sa description. Celui-ci peut donc être analysé, modifié et exécuté (A.5.). Une première discussion peut ainsi se faire sur la base de ce code source et des résultats produits par son exécution. Le code source doit être appuyé par une documentation qui rend compte du raisonnement et des choix retenus. Si celle-ci ne permet pas la réplicabilité complète du modèle (A.2. et A.3. insuffisants), laissant à l’implémentation informatique sa part d'implicite, elle demeure nécessaire pour donner une vue synthétique du modèle. En l’absence d’un standard officiel pour décrire le modèle de manière statique (A.2.) puis dynamique (A.3.), on pourra se référer au protocole ODD (Overview, Design concepts and Details) développé par l’équipe de

44 Lerner Reuven M, Levy Sharona T, Wilensky Uri, Encouraging Collaborative Constructionism: Principles

(19)

l’écologue Volker Grimm45. Ce formalisme de description largement reconnu et compris dans la

communauté des modélisateurs multi-agents permet de décrire les modèles en trois axes : (1) Vue d’ensemble, (2) Conception ; et (3) Détails46. Ce protocole est suffisamment générique pour

être adaptable à chaque modèle agent47. Les données utilisées par le modèle (A.6.) pourront être

jointes, de même que les informations sur les versions adaptées du logiciel de simulation (A.7.).

La reproductibilité de l’exploration du modèle

Un modèle peut être exécuté une fois pour en déduire des résultats (B.1.) et son exploration fait partie de son processus de construction. Dans la vie du modèle, avant la publication, il y a donc plusieurs explorations qui ont donné lieu à plusieurs modifications successives du code source du modèle. C’est suivant cet aller-retour, dans une démarche abductive, que les questions sont formulées et implémentées, que des explorations sont misent en œuvre pour tenter d’y répondre et que le raisonnement progresse (B.2.). La nature souvent stochastique des modèles agents (cf. chapitre 3) renforce la nécessité d’une exploration approfondie.

Dans ces conditions, envisager une réplicabilité des explorations ne peut se faire qu’en ayant recours à des outils et des techniques plus formels48 qui permettent de formaliser les modalités

d’expérimentation et les valeurs de paramètres à utiliser. L’étape de la réplicabilité nécessite parfois de faire appel à des ressources de calcul extérieures, supérieures à celles d'un ordinateur classique (avec le logiciel OpenMOLE49 par exemple qui mobilise des ressources en calculs

distribués50).

La reproductibilité des résultats : données et analyses reproductibles

Une dernière étape vers une reproductibilité « complète » d’un modèle consiste à rendre ses résultats reproductibles. La méthode la plus simple est de communiquer l’ensemble des données générées en sorties de simulations qui sont ensuite utilisées pour analyser le modèle. Compte

45 Grimm Volker, Revilla Eloy, Berger Uta, Jeltsch Florian, Mooij Wolf M, Railsback Steven F, Thulke

Hans-Hermann, Weiner Jacob et al., « Pattern-oriented modeling of agent-based complex systems: lessons from ecology », Science, 310(5750), 2005, p. 987-991.

46 Bouquet Fabrice, Sheeren David, Becu Nicolas, Gaudou Benoit, Lang Christophe, Marilleau Nicolas, Monteil

Claude, « Formalisme de description des modèles agent », dans Simulation spatiale à base d’agents avec NetLogo.

Volume 1 : introduction et bases, éd. par A. Banos, C. Lang, N. Marilleau, Londres, ISTE, 2015

47 Schmitt Clara, « Modélisation de la dynamique des systèmes de peuplement : de SimpopLocal à SimpopNet. »,

Thèse de Doctorat, Université Paris I - Panthéon-Sorbonne, 2014

48 Thiele Jan C, Kurth Winfried, Grimm Volker, « RNETLOGO: an R package for running and exploring

individual-based models implemented in NETLOGO », Methods in Ecology and Evolution, 3(3), 2012, p. 480-483.

49 Reuillon Romain, Leclaire Mathieu, Rey-Coyrehourcq Sebastien, « OpenMOLE, a workflow engine specifically

tailored for the distributed exploration of simulation models », Future Generation Computer Systems, 29(8), 2013, p. 1981–1990.

(20)

tenu des plans d’expériences que l’on aura mobilisés et de la stochasticité des modèles nécessitant de nombreuses réplications, cette masse de données peut être conséquente et difficile à gérer. Pour pallier cette difficulté, il est possible de communiquer des « graines aléatoires »51

utilisées dans l'expérimentation, permettant à l'aide des mêmes versions de logiciels de reproduire à l’identique les simulations. Reproduire et rendre accessibles les données brutes est une première étape, mais encore faut-il être en mesure de reproduire également la manière dont elles ont été mobilisées et exploitées dans les différentes analyses. C’est ce que permettent par exemple les « notebooks » (carnets etc.) qui visent à consigner tous les éléments au sein d’un même document.

Une proposition d’application au modèle de Young

Afin d'illustrer concrètement l’ensemble des étapes abordées dans la partie précédente, nous proposons une application à l’un des modèles présenté et développé dans le Chapitre 3, le modèle de Young5253.

Publier le modèle

Une première description du modèle a été publiée (figure 3, A.1.) par Young54, dans un article qui

se révèle toutefois « [caractérisé] par une certaine ambiguïté dans la description de son modèle, rendant difficile sa reproductibilité » (cf. chapitre 3). La description et l'analyse qui en est faite dans le chapitre 3 a permis d’expliciter certains des points laissés flous par l’auteur de la version initiale et d’obtenir une description plus précise et standardisée (A.3.). Ce travail a permis aux auteurs du chapitre 3 de développer (en NetLogo), une version du modèle dont ils maîtrisaient mieux les fonctions et les paramètres pour mener à bien leur exploration thématique sur le processus de colonisation. Ces développements s’inscrivent dans la démarche de reproductibilité de U. Wilensky. Il est désormais possible de publier la nouvelle implémentation informatique du modèle de Young sur une plate-forme publique de dépôt logiciel adaptée55. Cela permet de

capitaliser l'expérience menée dans le programme TransMonDyn et de mettre le modèle à diposition d’autres chercheurs. La plate-forme utilisée permet une consultation publique du code

51 En informatique, l’aléa n’est ainsi jamais complètement aléatoire : il se base sur une « graine aléatoire »

(randomseed), c’est-à-dire un nombre qui va permettre de générer de manière prévisible l’ensemble des nombres aléatoires demandés par la suite. En conservant cette « graine », on peut donc re-générer les mêmes nombres aléatoires, et ainsi répliquer à l’identique l'exécution d’une simulation.

52 Young David A, « A New Space-Time Computer Simulation Method for Human Migration », American

Anthropologist, 104(1), 2002, p. 138-158.

53 À noter que le modèle implémenté de Young (M1_FS-Young) décrit dans ce chapitre contient aussi une

implémentation du modèle de Fisher-Skellam. Nous ne commenterons ici pas le comportement de ce modèle alternatif.

54 Young David A, « A New Space-Time Computer Simulation…», op. cit.

(21)

source56 (A.5.). Ainsi il est possible de proposer des modifications du code grâce à une interface

en ligne adaptée. L'auteur du dépôt logiciel est alors en mesure d’accepter ou non ces modifications. Le modèle étant hébergé publiquement sur Internet, il est possible de réaliser des simulations interactivement5758 (figure 4). Ce site internet permet en effet d'exécuter tout modèle

NetLogo accessible en ligne dans un simple navigateur internet (A.4.). Cette possibilité donne l'opportunité de communiquer le contenu du modèle de manière dynamique et scientifique. Ce type de publication répond également à un objectif pédagogique en faisant comprendre les concepts mobilisés par la manipulation des paramètres du modèle.

Le code source étant publié, il est aussi possible de le télécharger pour exécuter le modèle localement sur son propre ordinateur. Dans ce cas, les « dépendances logicielles » – la version du logiciel NetLogo à utiliser par exemple – sont indiquées directement dans la documentation en ligne59, satisfaisant au dernier critère de reproductibilité (A.7.). Le respect de ce dernier principe

tend à assurer une pérennité au modèle en palliant les problèmes d'obsolescence des plates-formes logicielles.

Dans notre exemple, notons que nous n’avons pas à fournir de données d’entrée (A.6.), puisque le modèle de Young, tel qu’implémenté, n’en fait pas usage. Si tel était le cas, on pourrait profiter du même « dépôt logiciel » qui héberge le code source pour stocker les données, ou encore les héberger sur une plate-forme externe dédiée60.

(Fig. 4)

Figure 4 : Version exécutable en ligne et code source du modèle de Young.

56À cette adresse :

https://github.com/TransMonDyn/YoungModelExploration/blob/master/Model/M1_FS-Young.nlogo

57En ouvrant cette page avec un navigateur internet récent : http://www.netlogoweb.org/web?

https://raw.githubusercontent.com/TransMonDyn/YoungModelExploration/master/Model/M1_FS-Young.nlogo

58 Via le site NetLogoWeb : http://www.netlogoweb.org/

59https://github.com/TransMonDyn/YoungModelExploration/tree/master/Model 60 Par exemple Figshare : https://figshare.com/

(22)

Publier l’exploration de manière reproductible : un outil de collaboration

Le chapitre 3 a montré une exploration « heuristique » du modèle. Nous nous attacherons ici à développer et à généraliser cette exploration, tout en visant à la reproductibilité de chacune des étapes empruntées. Les résultats présentés dans la figure 5 permettent d’illustrer la démarche qui a été suivie dans cet exemple d’exploration et constituent une première étape dans la reproductibilité du modèle en mettant à disposition des graphiques synthétiques montrant son comportement (palier B.1. de la figure 3). Les sources de cette analyse sont disponibles par ailleurs61 (palier B.2.), rendant possible sa reproduction.

La première étape consiste à explorer l’espace des paramètres : comment réagissent les différents indicateurs à un changement de valeur des paramètres ? L’exploration est de type « plan complet », i.e. le plan d'expérience fait varier chaque paramètre indépendamment des autres et explore systématiquement l’ensemble des combinaisons possibles. Quatre paramètres sont mobilisés ici : probabilité de naissance, de mort, de déplacement, de mort par « suroccupation ». Chaque point de la figure 5(1) représente une simulation : il se situe au croisement de deux indicateurs, la part de l’espace occupé et la taille de la population en fin de simulation. Des valeurs élevées de ces deux indicateurs traduisent une colonisation « réussie ». L’exploration est « grossière » dans la mesure où l'échelle de variabilité retenue pour chacun de ces paramètres est assez large (0, 0.33, 0.66 et 1).

On peut remarquer dans la figure 5(1) que les indicateurs ne sont pas « satisfaisants » pour une probabilité de déplacement inférieure à 0,66 dans le cas d’une probabilité de mort de 0,33. Pour de telles valeurs (cf. les deux derniers schémas de la figure 5(1)), on y note aussi que les meilleurs résultats sont obtenus pour une probabilité de mort par suroccupation de 0,33, et que les « meilleurs » résultats semblent se situer entre une probabilité de déplacement de 0,66 (forte population, mais moindre occupation de l’espace) et de 1 (meilleure occupation, mais moindre population). Ce type d’exploration permet donc d’isoler des sous-espaces de paramètres qui semblent intéressant à analyser plus en profondeur avec d’autres méthodes.

On peut pour cela mener une autre exploration (figure 5(2) et (3)), qui correspond ici à un calcul d'optimisation. L’algorithme recherche dans l’espace des paramètres, les valeurs qui permettent d’atteindre des objectifs fixés à l’avance. Il s’agit par exemple de rechercher la combinaison de valeurs de paramètres permettant de maximiser à la fois la taille de la population et la part de l’espace occupé en fin de simulation. Les résultats de l’exploration forment des classes (notées A, B, C et D), bien identifiables sur la figure 5(2). Ces classes de simulations sont décrites à l'aide des combinaisons des quatre paramètres en jeu (figure 5 (3)). La classe D qui correspond à des populations faibles et à une occupation de l'espace moindre est insatisfaisante. Les classes B et C produisent les meilleurs résultats sur chacun un des objectifs. La classe A est celle qui

(23)

maximise à la fois la population et l’espace occupé. Cette démarche d’exploration du « grossier » au raffiné permet d’ajuster les paramètres et de mieux comprendre le comportement du modèle. Cet exemple d'application illustre la manière dont les sciences humaines pourraient capitaliser leur expérience via la modélisation pour atteindre l'objectif de cumulativité des connaissances dans un cadre formalisé, prôné par D. Pumain62.

(Fig. 5)

(24)

Figure 5 : Résultats synthétiques des étapes d'une exploration du modèle de Young.

NB : Dans la partie (1), les points étant en partie transparents, une forte opacité indique une superposition de nombreux points. Dans la partie (3), les graphiques sont de type « violin plots » : la largeur de chaque barre décrit la densité relative de simulations d’une classe (marquées dans la partie (2)) pour chaque valeur des paramètres correspondants.

(25)

Les propositions méthodologiques et techniques faites dans ce chapitre méritent sans doute d'être éprouvées et discutées mais elles permettent d'ouvrir des perspectives dans un débat que les SHS ne peuvent ignorer. Nous avons délibérément centré notre propos sur le cadre conceptuel et les modèles agents, mais il est bien évident que cette discussion doit s'ouvrir et se poursuivre car elle concerne toutes les étapes de la modélisation et tous les types de formalisme. En effet, nous n'avons pas abordé ici la question de la formalisation du modèle conceptuel de données et des hypothèses théoriques, mais elle a fait l'objet de nombreux débats au sein du programme.

Un autre point nous semble important, mais échappe encore à un traitement approfondi : il s’agit de l'articulation entre le cadre conceptuel et les modèles du point de vue de la reproductibilité. En effet, à ce stade du projet on observe un important écart entre l'outil d'explicitation du cadre conceptuel TransMonDyn et celui qui permet de passer au modèle proprement dit. Les choix opérés par le collectif en termes de fonctionnement (cf. Introduction générale) couplés à une durée limitée dans le cadre du programme TransMonDyn sont très certainement à l'origine de cet écart sur lequel il convient de se pencher à l'avenir pour améliorer le travail interdisciplinaire et faire jouer pleinement son rôle de médiateur à la modélisation.

Dans ce chapitre, il nous a paru important de d'abord dissocier la technique et les outils de la problématique purement conceptuelle et de l’apport de connaissances pour les réunir ensuite dans une démarche proposant un schéma de réflexion innovant associé à des solutions existantes pratiques mais non « gadget ». Cette proposition vise à alimenter le débat sur les questions de reproductibilité scientifique en suggérant une évolution des pratiques dans un cadre interdisciplinaire sans stigmatisation, du fait du contexte d’une part (science sous pression), du fait de la complexité et de l’évolution rapide des traitements et questions d’autre part. La pluralité des points de vue qui semble parfois aller à l’encontre des sciences dites appliquées, questionne la notion de transparence d'une autre manière et contribue à capitaliser les connaissances avec un autre type de plus-value.

Figure

Figure 1 : Schéma général de la démarche du transfert du cadre conceptuel.
Figure 2 : Schéma d’application du cadre conceptuel à trois cas d’étude intra-urbains : Beauvais, Noyon et Tours.
Figure 3 : Les paliers de réplicabilité d’un modèle de simulation et de son exploration
Figure 4 : Version exécutable en ligne et code source du modèle de Young.
+2

Références

Documents relatifs

En effet, alors même qu'il est un outil d'harmonisation et de cohérence pour l'ensemble des normes comptables internationales, qu'il oriente l'élaboration mais aussi

Les mathématiques traitent de la reconnaissance, de la description et de la manipulation de régularités numériques et non numériques. Les régularités figurent dans tous les

On peut vaincre la pauvreté si l’on s’attaque de front au chômage des jeunes. Il est largement établi que la pauvreté intergénérationnelle – celle que les parents transmettent

■ Definir des priorites et des mesures strategiques propres a accelerer Vintegration regionale : dans le contexte de l'Union africaine, le Forum e"tudiera et de'terminera

Depuis les années 1980, on assiste à un engouement aux modèles d’équilibre général calculable (MEGC) dans l’analyse des effets de politiques économiques diverses.. Cet

1.1 Objectif spécifique de la recherche. L'objectif spécifique retenu dans ce travail en vue d'accéder à une meilleure compréhension de la notion de

● « événement dommageable au patient sans qu’une maladresse ou une faute quelconque puisse être imputée au praticien et sans que ce dommage ne se relie à l’état

L’erreur fait suite à une omission ou un acte, non intentionnel, ne relevant pas d’une infraction à une règle : elle se situe en amont de la faute mais ne