• Aucun résultat trouvé

analyse et simulation de la r´ egulation

5.2 Mod` ele et algorithme du comportement des acteurs sociaux

La SAO postule que les acteurs sociaux sont strat´egiques, motiv´es par une vis´ee non n´ecessairement explicite, et qu’ils exercent leur strat´egie dans le cadre d’une rationalit´e limit´ee. Dans un premier temps, nous pr´esentons le concept de rationalit´e limit´ee, puis nous d´etaillerons le processus de d´ecision des acteurs. Nous exposerons ensuite la fa¸con dont nous simulons la r´egulation du comportement des acteurs.

5.2.1 L’hypoth`ese de rationalit´e limit´ee

La rationalit´e limit´ee est un concept introduit par Herbert Simon [Simon, 1984]. Elle s’oppose au postulat de rationalit´e substantive traditionnellement utilis´e en ´economie, et repose sur trois notions : l’imperfection de l’information, la difficult´e de l’anticipation et le nombre limit´e des comportements envisageables .

Explicitons rapidement ces trois notions. Confront´e `a une situation dans laquelle il doit prendre une d´ecision, un individu ne dispose que d’informations biais´ees, fragmentaires pour analyser la situation.

Ceci est particuli`erement vrai dans le domaine du social, du fait de l’opacit´e de tout syst`eme social, du caract`ere plus ou moins implicite des r`egles,toujours ambivalentesselon Friedberg[Friedberg, 1993], et des diff´erentes interpr´etations que chacun peut en faire [Roggero and Vautier, 2003]. Il est donc difficile pour l’acteur d’appr´ehender compl`etement les cons´equences de ses actions.

Le comportement d’un acteur dans une telle situation rel`eve essentiellement de l’intuition et de l’exp´erience. Dans [”March and Simon, 1991], Simon montre que l’interaction entre stimuli et m´emoire

´evoqu´ee est un des traits pr´edominants de la prise de d´ecision : un stimulus provoquera [...] une

d´efinition bien structur´ee de la situation qui comprendra un r´epertoire des sch´emas de r´eponses et des sch´ema permettant la s´election d’une r´eponse appropri´ee.

Il ne peut alors concevoir qu’un nombre limit´e de solutions pour r´esoudre le probl`eme auquel il doit faire face. Le champ des comportements possibles est donc limit´e, et souvent, la d´ecision rel`eve davantage d’une logique stimulus-r´eponse que de l’arbitrage raisonn´e entre plusieurs alternatives, bas´e sur une analyse rationnelle et parfaite[Scieur, 2005].

Simon a aussi montr´e que l’homme manifeste difficilement des pr´ef´erences claires et coh´erentes.

Celles-ci peuvent ´evoluer au gr´e des circonstances, de ses perceptions ou encore de ses aspiration[Scieur, 2005], ce qui rend d’autant plus difficile l’´evaluation a priori des cons´equences des alternatives qu’il est en

mesure d’envisager.

Selon ces hypoth`eses, le comportement d’un acteur ne consiste pas `a optimiser son choix vis-`a-vis de sesaspirations, ne serait-ce que parce qu’il est peu capable d’en d´eterminer l’optimum ; mais `a s’en tenir `a la premi`ere solutionsatisfaisantequ’il rencontrera. Simon utilise le terme de ”satisficing”1 pour d´enoter une situation suffisament satisfaisante, combinaison des termes satisfy et suffic-ing [Simon, 1956].

L’algorithme dont les acteurs sont dot´es pour jouer le jeu social impl´emente ces diff´erents ´el´ements en les dotant d’une vision locale et fragmentaire de la structure de l’organisation, d’une ambition non pr´ed´efinie, ´evolutive et d’un processus de d´ecision qui vise non pas une situation optimale mais une situation satisfaisante.

En effet, d’une part, un acteur ne connait pas la structure de l’organisation dont il fait partie : connaˆıtre les relations de l’organisation, qui les contrˆole, les enjeux de chacun et les fonctions d’effets reviendrait `a raisonner en information compl`ete et `a d´eterminer a priori quel est l’´etat optimal du syst`eme au regard de ses objectifs. Ceci vaut pour les relations dont l’acteur d´epend, eta fortiori pour celles dont il ne d´epend pas. Nos acteurs sociaux se contentent donc de percevoir leur situation par la valeur de l’impact des relations dont ils d´ependent.

Ensuite, les aspirations d’un acteur social (i.e. le niveau de r´ealisation de son m´eta-objectif qu’il estime suffisamment satisfaisant) ´etant d´ependantes du contexte, le niveau d’aspiration d’un acteur n’est pas pr´ed´efini, mais calcul´e dynamiquement sous la forme d’une variable l’ambition, mise `a jour en fonction de la situation courante de l’acteur.

Lorsque tous les acteurs atteignent une situation satisfaisante, ils n’ont plus mati`ere `a modifier leurs comportements. La simulation peut s’arrˆeter, l’organisation est alors r´egul´ee .

5.2.2 Le processus de d´ecision

Classiquement, le processus de d´ecision est organis´e selon les trois ´etapes suivantes : 1. laperception par l’individu de sa situation et de son contexte,

2. lad´ecision : s´election parmi les actions envisageables de celle(s) qui semble la meilleure, 3. l’action : effectuer l’action s´electionn´ee (dans la mesure o`u elle est r´ealisable).

Selon Simon [Simon, 1984], un acteur s´electionne son action sur la base de son effet escompt´e[Simon, 1947], selon une rationalit´eproc´edurale, qui consiste `a ´evaluer les possibilit´es d’action en fonction du contexte.

D’apr`es [Parthenay, 2004], les acteurs d´elib`erent (rationalit´e proc´edurale) plus qu’ils ne calculent (rationalit´e substantive) selon le processus suivant :

1. l’identification des alternatives possibles dans le contexte courant, 2. la d´etermination des cons´equences de ces alternatives,

3. la comparaison de l’efficacit´e de ces cons´equences (au regard de l’objectif poursuivi), 4. s´election d’une alternative

1. On pourrait proposer la traduction approximative ”satisuffisant”, qui si elle n’est pas tr`es jolie, a le m´erite d’ˆetre originale et satisuffisante pour l’auteur.

Un acteur ´evalue dynamiquement les cons´equences de ses actions et se construit, par l’exp´erience, une base de connaissances permettant d’associer `a une situation l’action qu’il a int´erˆet `a entrepren-dre. Pour mod´eliser ce processus, nous avons retenu la m´ethode d’apprentissage par renforcement [Sutton and Barto, 1998]. Il s’agit d’une m´ethode d’apprentissage non-supervis´ee dans laquelle l’ac-teurexp´erimente les cons´equences des actions qu’il entreprend et associe au couple (situation, action) une certaine efficacit´e en comparant sa nouvelle situation par rapport `a la pr´ec´edente. La base de connaissances que se construit ainsi l’acteur est utilis´ee lorsque il se trouve dans une situation proche d’autres d´ej`a rencontr´ees, lui permettant de classer les actions possibles selon leur efficacit´e apprise.

5.2.3 Le m´eta-objectif des acteurs sociaux

Selon la SAO, les acteurs d’une organisation sont strat´egiques et ajustent leurs comportements de fa¸con finalis´ee, c’est-`a-dire en accord avec une certaine vis´ee,orient´ee de fa¸con `a atteindre un objectif personnel, compte tenu des contraintes de la situation ([Erhard, 1988], cit´e dans[Scieur, 2005] p86 ). Dans le contexte organisationnel, o`u les acteurs sont interd´ependants pour l’acc`es aux ressources n´ecessaires `a la r´ealisation de leurs objectifs, et compte tenu du fait que chacun a int´erˆet au bon fonctionnement de l’organisation, les acteurs vont ajuster leurs comportements en cherchant `a placer le syst`eme dans une configuration leur procurant le meilleur acc`es `a ces ressources.

Nous avons mod´elis´e la qualit´e de cet acc`es avec la capacit´e d’action. De fa¸con `a tenir compte des solidarit´es qu’un acteur peut entretenir d’autres, dimension essentielle du social, nous utilisons l’indicateur de satisfaction pour ´evaluer la situation d’un acteur. Dans ce cadre, l’objectif poursuivi par un acteur est de pr´eserver ou d’am´eliorer sa satisfaction. Il s’agit du m´eta-objectif commun `a tous les acteurs2.

5.2.4 La simulation du jeu social

L’algorithme de simulation du jeu social est ordonnanc´e par une boucle principale selon laquelle les acteurs s´electionnent leur action ind´ependamment les uns des autres.

Le test d’arrˆet de la boucle principale correspond `a l’obtention du m´eta-objectif que nous venons de voir.

Algorithm 1 Pseudo-code de la boucle principale de l’algorithme de simulation. Tir´e de [El Gemayel et al., 2011]

whileun acteur n’est pas satisfait do for allacteur a do

situation←perception() ;

actiona←selection action(situation) ; end for

for allrelation r do appliquer(r, actiona) end for

end while

Le fait qu’une relation soit contrˆol´ee par un unique acteur permet de mettre `a jour l’´etat de chaque relation sans gestion externe du syst`eme pour en assurer la coh´erence, comme d´ecrit dans la section 1.4 du chapitre trois3

2. Dans certains cas, et en connaissance de cause, le mod´elisateur peut d´ecider de simuler le comportements des acteur avec un m´eta-objectif diff´erenci´e, en choisissant par exemple de remplacer la satisfaction par l’influence, ou le pouvoir, pour d´eterminer dans quelles situations l’acteur s’estime ”satisfait”.

3. Le mod`ele peut cependant ˆetre ´etendu pour permettre le contrˆole partag´e des relations. Dans ce cas, les d´eplacement de l’´etat d’une relation par plusieurs acteurs seront appliqu´es au prorata de leur contrˆole. Une alternative est de ne permettre qu’`a un seul contrˆoleur de modifier l’´etat d’une relation par ´etape, et de r´epartir la fr´equence `a laquelle l’´etat peut ˆetre modifi´e entre les contrˆoleurs au pro-rata de leur contrˆoles.

Si, `a une ´etape de cette boucle, tous les acteurs sont satisfaits, ils n’ont plus besoin de modifier leur comportement : la simulation a atteint un ´etat stationnaire, l’organisation est r´egul´ee. Sinon, elle se poursuit et s’arrˆete, en tout ´etat de cause, lorsqu’est atteint le nombre maximal d’´etapes que l’exp´erimentateur aura d´efini.

La longueur des simulations et leur taux de convergence constituent un indicateur de la facilit´e qu’ont les acteurs `a coop´erer, sur lequel nous revenons dans la section 5.5.1.

L’algorithme ne converge pas syst´ematiquement, notamment dans le cas des jeux `a somme nulle, o`u, d`es qu’un acteur gagne une certaine quantit´e de satisfaction, celle-ci est perdue par un (ou plusieurs) autre(s) acteur(s). Il est alors tr`es peu probable que la satisfaction courante de chaque acteur d´epasse son seuil d’ambition. Exp´erimentalement, on constate que l’algorithme converge mal dans le cas de tels jeux.

Plus g´en´eralement, quand les jeux ne sont pas `a somme nulle, rien ne permet de pr´ed´eterminer que chacune des r´egulations d’une exp´erience de simulation va converger vers un optimum global (mˆeme si les r´esultats de cet algorithme sont g´en´eralement proches de l’optimum de Pareto), ni mˆeme au voisinage d’un seul ´etat. Les organisations peuvent porter dans leur structure plusieurs potentialit´es [Barel, 1979], plusieurs modes de fonctionnement, susceptibles d’ˆetre atteints par cet algorithme4. Cela est notamment le cas de l’exemple trait´e dans [El Gemayel et al., 2011].

Documents relatifs