Mod` ele et algorithme du comportement des acteurs sociaux

analyse et simulation de la r´ egulation

5.2 Mod` ele et algorithme du comportement des acteurs sociaux

La SAO postule que les acteurs sociaux sont stratégiques, motivés par une visée non nécessairement explicite, et qu’ils exercent leur stratégie dans le cadre d’une rationalité limitée. Dans un premier temps, nous présentons le concept de rationalité limitée, puis nous détaillerons le processus de décision des acteurs. Nous exposerons ensuite la fa¸con dont nous simulons la régulation du comportement des acteurs.

5.2.1 L’hypothèse de rationalité limitée

La rationalité limitée est un concept introduit par Herbert Simon [Simon, 1984]. Elle s’oppose au postulat de rationalité substantive traditionnellement utilisé en économie, et repose sur trois notions : l’imperfection de l’information, la difficulté de l’anticipation et le nombre limité des comportements envisageables .

Explicitons rapidement ces trois notions. Confronté à une situation dans laquelle il doit prendre une décision, un individu ne dispose que d’informations biaisées, fragmentaires pour analyser la situation.

Ceci est particulièrement vrai dans le domaine du social, du fait de l’opacité de tout système social, du caractère plus ou moins implicite des règles,^≪toujours ambivalentes^≫selon Friedberg[Friedberg, 1993], et des différentes interprétations que chacun peut en faire [Roggero and Vautier, 2003]. Il est donc difficile pour l’acteur d’appréhender complètement les conséquences de ses actions.

Le comportement d’un acteur dans une telle situation relève essentiellement de l’intuition et de l’expérience. Dans [”March and Simon, 1991], Simon montre que l’interaction entre stimuli et mémoire

évoquée est un des traits prédominants de la prise de décision : un stimulus ^≪provoquera [...] une

définition bien structurée de la situation qui comprendra un répertoire des schémas de réponses et des schéma permettant la sélection d’une réponse appropriée^≫.

Il ne peut alors ^≪concevoir qu’un nombre limité de solutions pour résoudre le problème auquel il doit faire face. Le champ des comportements possibles est donc limité, et souvent, la décision relève davantage d’une logique stimulus-réponse que de l’arbitrage raisonné entre plusieurs alternatives, basé sur une analyse rationnelle et parfaite^≫[Scieur, 2005].

Simon a aussi montré que l’homme ^≪manifeste difficilement des préférences claires et cohérentes.

Celles-ci peuvent évoluer au gré des circonstances, de ses perceptions ou encore de ses aspiration^≫[Scieur, 2005], ce qui rend d’autant plus difficile l’évaluation a priori des conséquences des alternatives qu’il est en

mesure d’envisager.

Selon ces hypothèses, le comportement d’un acteur ne consiste pas à optimiser son choix vis-à-vis de sesaspirations, ne serait-ce que parce qu’il est peu capable d’en déterminer l’optimum ; mais à s’en tenir à la première solution^≪satisfaisante^≫qu’il rencontrera. Simon utilise le terme de ”satisficing”¹ pour dénoter une situation suffisament satisfaisante, combinaison des termes ^≪satisfy^≫ et ^≪ suffic-ing^≫ [Simon, 1956].

L’algorithme dont les acteurs sont dotés pour jouer le jeu social implémente ces différents éléments en les dotant d’une vision locale et fragmentaire de la structure de l’organisation, d’une ambition non prédéfinie, évolutive et d’un processus de décision qui vise non pas une situation optimale mais une situation satisfaisante.

En effet, d’une part, un acteur ne connait pas la structure de l’organisation dont il fait partie : connaˆıtre les relations de l’organisation, qui les contrôle, les enjeux de chacun et les fonctions d’effets reviendrait à raisonner en information complète et à déterminer a priori quel est l’état optimal du système au regard de ses objectifs. Ceci vaut pour les relations dont l’acteur dépend, eta fortiori pour celles dont il ne dépend pas. Nos acteurs sociaux se contentent donc de percevoir leur situation par la valeur de l’impact des relations dont ils dépendent.

Ensuite, les aspirations d’un acteur social (i.e. le niveau de réalisation de son méta-objectif qu’il estime suffisamment satisfaisant) étant dépendantes du contexte, le niveau d’aspiration d’un acteur n’est pas prédéfini, mais calculé dynamiquement sous la forme d’une variable l’ambition, mise à jour en fonction de la situation courante de l’acteur.

Lorsque tous les acteurs atteignent une situation satisfaisante, ils n’ont plus matière à modifier leurs comportements. La simulation peut s’arrêter, l’organisation est alors régulée .

5.2.2 Le processus de d´ecision

Classiquement, le processus de décision est organisé selon les trois étapes suivantes : 1. laperception par l’individu de sa situation et de son contexte,

2. ladécision : sélection parmi les actions envisageables de celle(s) qui semble la meilleure, 3. l’action : effectuer l’action sélectionnée (dans la mesure où elle est réalisable).

Selon Simon [Simon, 1984], un acteur sélectionne son action sur la base de son effet escompté[Simon, 1947], selon une rationalitéprocédurale, qui consiste à évaluer les possibilités d’action en fonction du contexte.

D’après [Parthenay, 2004], les acteurs délibèrent (rationalité procédurale) plus qu’ils ne calculent (rationalité substantive) selon le processus suivant :

1. l’identification des alternatives possibles dans le contexte courant, 2. la d´etermination des cons´equences de ces alternatives,

3. la comparaison de l’efficacité de ces conséquences (au regard de l’objectif poursuivi), 4. sélection d’une alternative

1. On pourrait proposer la traduction approximative ”satisuffisant”, qui si elle n’est pas très jolie, a le mérite d’être originale et satisuffisante pour l’auteur.

Un acteur évalue dynamiquement les conséquences de ses actions et se construit, par l’expérience, une base de connaissances permettant d’associer à une situation l’action qu’il a intérêt à entrepren-dre. Pour modéliser ce processus, nous avons retenu la méthode d’apprentissage par renforcement [Sutton and Barto, 1998]. Il s’agit d’une méthode d’apprentissage non-supervisée dans laquelle l’ac-teurexpérimente les conséquences des actions qu’il entreprend et associe au couple (situation, action) une certaine efficacité en comparant sa nouvelle situation par rapport à la précédente. La base de connaissances que se construit ainsi l’acteur est utilisée lorsque il se trouve dans une situation proche d’autres déjà rencontrées, lui permettant de classer les actions possibles selon leur efficacité apprise.

5.2.3 Le m´eta-objectif des acteurs sociaux

Selon la SAO, les acteurs d’une organisation sont stratégiques et ajustent leurs comportements de fa¸con finalisée, c’est-à-dire en accord avec une certaine visée,^≪orientée de fa¸con à atteindre un objectif personnel, compte tenu des contraintes de la situation^≫ ([Erhard, 1988], cité dans[Scieur, 2005] p86 ). Dans le contexte organisationnel, où les acteurs sont interdépendants pour l’accès aux ressources nécessaires à la réalisation de leurs objectifs, et compte tenu du fait que chacun a intérêt au bon fonctionnement de l’organisation, les acteurs vont ajuster leurs comportements en cherchant à placer le système dans une configuration leur procurant le meilleur accès à ces ressources.

Nous avons modélisé la qualité de cet accès avec la capacité d’action. De fa¸con à tenir compte des solidarités qu’un acteur peut entretenir d’autres, dimension essentielle du social, nous utilisons l’indicateur de satisfaction pour évaluer la situation d’un acteur. Dans ce cadre, l’objectif poursuivi par un acteur est de préserver ou d’améliorer sa satisfaction. Il s’agit du méta-objectif commun à tous les acteurs².

5.2.4 La simulation du jeu social

L’algorithme de simulation du jeu social est ordonnancé par une boucle principale selon laquelle les acteurs sélectionnent leur action indépendamment les uns des autres.

Le test d’arrêt de la boucle principale correspond à l’obtention du méta-objectif que nous venons de voir.

Algorithm 1 Pseudo-code de la boucle principale de l’algorithme de simulation. Tir´e de [El Gemayel et al., 2011]

whileun acteur n’est pas satisfait do for allacteur a do

situation←perception() ;

action_a←selection action(situation) ; end for

for allrelation r do appliquer(r, actiona) end for

end while

Le fait qu’une relation soit contrôlée par un unique acteur permet de mettre à jour l’état de chaque relation sans gestion externe du système pour en assurer la cohérence, comme décrit dans la section 1.4 du chapitre trois³

2. Dans certains cas, et en connaissance de cause, le modélisateur peut décider de simuler le comportements des acteur avec un méta-objectif différencié, en choisissant par exemple de remplacer la satisfaction par l’influence, ou le pouvoir, pour déterminer dans quelles situations l’acteur s’estime ”satisfait”.

3. Le modèle peut cependant être étendu pour permettre le contrôle partagé des relations. Dans ce cas, les déplacement de l’état d’une relation par plusieurs acteurs seront appliqués au prorata de leur contrôle. Une alternative est de ne permettre qu’à un seul contrôleur de modifier l’état d’une relation par étape, et de répartir la fréquence à laquelle l’état peut être modifié entre les contrôleurs au pro-rata de leur contrôles.

Si, à une étape de cette boucle, tous les acteurs sont satisfaits, ils n’ont plus besoin de modifier leur comportement : la simulation a atteint un état stationnaire, l’organisation est régulée. Sinon, elle se poursuit et s’arrête, en tout état de cause, lorsqu’est atteint le nombre maximal d’étapes que l’expérimentateur aura défini.

La longueur des simulations et leur taux de convergence constituent un indicateur de la facilité qu’ont les acteurs à coopérer, sur lequel nous revenons dans la section 5.5.1.

L’algorithme ne converge pas systématiquement, notamment dans le cas des jeux à somme nulle, où, dès qu’un acteur gagne une certaine quantité de satisfaction, celle-ci est perdue par un (ou plusieurs) autre(s) acteur(s). Il est alors très peu probable que la satisfaction courante de chaque acteur dépasse son seuil d’ambition. Expérimentalement, on constate que l’algorithme converge mal dans le cas de tels jeux.

Plus généralement, quand les jeux ne sont pas à somme nulle, rien ne permet de prédéterminer que chacune des régulations d’une expérience de simulation va converger vers un optimum global (même si les résultats de cet algorithme sont généralement proches de l’optimum de Pareto), ni même au voisinage d’un seul état. Les organisations peuvent porter dans leur structure plusieurs potentialités [Barel, 1979], plusieurs modes de fonctionnement, susceptibles d’être atteints par cet algorithme⁴. Cela est notamment le cas de l’exemple traité dans [El Gemayel et al., 2011].

Dans le document Modélisation et analyse des organisations sociales : propriétés structurelles, régulation des comportements et évolution (Page 102-105)