• Aucun résultat trouvé

2. L’altruisme évolutionnaire

2.3. L’altruisme évolutionnaire propre aux êtres humains

2.3.4. La punition altruiste

Les chercheurs de la seconde génération de la théorie des jeux ont montré que beaucoup de comportements humains paraissent altruistes évolutionnaires sans l’être en réalité. Des actions ponctuelles coûteuses pour l’individu peuvent être induites par une stratégie comportementale évolutionnairement non altruiste (qui s’avère avantageuse sur le long terme). Les théories de la réciprocité directe, indirecte et du signal coûteux permettent de comprendre le haut degré de coopération pratiqué par les êtres humains mais ce faisant, elles restreignent indéniablement le champ de l’altruisme évolutionnaire.

137

Cette seconde condition marque le fait que si l’on veut se départir d’une mauvaise réputation, il peut valoir la peine d’aider un individu quelle que soit sa réputation (à ce propos, voir LEIMAR & HAMMERSTEIN 2001).

De manière assez intéressante, ce même groupe de chercheurs (GINTIS 2000 ; BOYD et al. 2003 ; FEHR & FISCHBACHER 2003) à mis en évidence un comportement altruiste évolutionnaire typiquement humain : la « punition altruiste ». Il s’agit d’un comportement justicier qui consiste à punir les opportunistes sans qu’il en résulte un bénéfice à long terme pour le punisseur.138 Cette punition est altruiste, d’une part parce qu’elle engendre un coût (pour punir, il faut investir de l’énergie et des moyens), d’autre part parce qu’elle n’est pas liée à un retour de service ultérieur en faveur du punisseur.139 De plus, ce comportement profite à d’autres individus car des tests empiriques ont montré que les opportunistes punis se comportent de manière nettement plus coopérative lors d’interactions ultérieures (FEHR &FISCHBACHER 2003). Enfin, la

punition altruiste engendre des effets bénéfiques pour la coopération et l’entraide parce qu’elle force même les individus égoïstes à agir pour le bien d’autrui ; soudain, il vaut mieux être coopératif plutôt que de risquer la punition.

Des expériences ont montré que, dans les faits, les gens utilisent la punition altruiste dans des situations d’interaction sociale. Ernst FEHR et collègues (FEHR &

GÄCHTER 2002 ;FEHR &FISCHBACHER 2004a) ont fait jouer des sujets humains à des

variantes de différents jeux (dilemme du prisonnier, jeu de la confiance, jeu du bien commun, etc.) dans lesquels ils ont intégré le paramètre de la punition. Les résultats empiriques indiquent que s’ils en ont la possibilité, beaucoup de sujets sont prêts à punir les opportunistes à leurs propres frais tout en sachant qu’ils ne les rencontreront plus dans le cours du jeu (c’est-à-dire n’attendant aucun bénéfice en retour de leur punition).

138

Dans un bon nombre d’écrits, on trouve ce comportement punitif associé au comportement d’aide à autrui pour former une seule stratégie : la « réciprocité forte » (strong reciprocity) (FEHR &GÄCHTER 1998; FEHR &FISCHBACHER 2003 ; GINTIS 2000). La réciprocité forte revient à afficher deux types de comportements en fonction du déroulement de l’interaction : récompenser la coopération et punir la non- coopération (dans les deux cas sans qu’il y ait retour de bénéfice ultérieur). Toutefois, il n’y a aucune raison de principe de considérer ces deux stratégies comme un tout indissociable (voir LEHMANN & KELLER 2006). Il se peut que ces traits aient évolué de manière indépendante (même s’il est clair que les deux favorisent la coopération). Pour cette raison, j’ai préféré ne pas parler de la réciprocité forte dans le corps du texte et traiter de manière séparée l’aide à autrui et la punition altruiste.

139

C’est la raison pour laquelle des stratégies comme Donnant Donnant ne peuvent pas être considérées comme altruistes. Bien que coopérative et punitive, Donnant Donnant n’est pas altruiste car l’acte punitif n’engendre aucun coût supplémentaire (le punisseur refuse simplement de coopérer au coup suivant); au contraire, il permet ainsi d’éviter de se faire exploiter.

Sachant qu’au niveau individuel, il vaut mieux ne pas être altruiste puisque, par définition, les individus qui ne le sont pas s’en sortent mieux, comment peut-on expliquer que les comportements altruistes punitifs aient pu être sélectionnés au fil de l’évolution ? Il semblerait qu’il y ait différents facteurs complémentaires qui permettent d’expliquer la stabilisation des comportements altruistes punitifs.

Le premier facteur est celui du coût et de l’efficacité de la punition (BOYD & RICHERSON 1992). S’il y a suffisamment de punisseurs altruistes dans un groupe et que les punitions sont dissuasives (grand coût pour le puni), la coopération sera très répandue et les punisseurs altruistes devront rarement sévir, si bien que le coût engendré par leur comportement punitif sera moindre, voire nul. En comparaison des individus qui ne punissent pas, les punisseurs ne seront donc que légèrement désavantagés.140 Toutefois, ce facteur à lui seul n’est pas suffisant pour assurer l’évolution des comportements altruistes punitifs. En effet, même si les coûts engendrés par le fait d’être un punisseur altruiste sont moindres, il n’en demeure pas moins qu’il vaut mieux être un simple coopérateur plutôt qu’un punisseur altruiste en plus ; le coopérateur non- punisseur profite des effets bénéfiques des comportements altruistes punitifs sans porter lui-même les coûts occasionnés lors de la punition des opportunistes. Dans ce contexte, on peut parler d’opportunisme de second ordre (second order free riding). Il est intéressant de noter ici qu’un effet de la punition altruiste est de transformer des traits hautement altruistes (ceux qui induisent des actions coopératives dans un monde d’égoïstes) en des traits à la fois avantageux du point de vue individuel (si la punition est efficace, il vaut mieux coopérer que faire défection)141 et opportunistes de second ordre : dans un monde dominé par les altruistes punisseurs, la stratégie altruiste pure « Coopère toujours ! » peut être considérée comme opportuniste de second ordre.

L’opportunisme de second ordre nous force à chercher d’autres facteurs susceptibles de soutenir l’évolution de la punition altruiste. Notre second facteur est lié

140

Evidemment, l’aspect « coût pour le punisseur » doit également être pris en compte ; pour que la pratique de la punition puisse se répandre, il faut que le coût pour le punisseur soit nettement inférieur au coût pour le puni.

141

Lorsque la punition est extrêmement efficace, du point de vue des comportements, il n’y a plus moyen de distinguer entre les individus qui adoptent une stratégie coopérative uniquement dans un milieu punitif (afin d’éviter la punition) et ceux qui ont pour stratégie de toujours coopérer.

à la prescriptivité des comportements altruistes punitifs. Il repose sur l’idée qu’à un moment de l’histoire humaine, les normes sociales ont émergé.142 Les normes sociales sont associées à une attente de comportements conformes à ce qu’elles prescrivent ; en cas de non-conformité, il y a sanction (OSTROM 1998). Pour renforcer les normes sociales, les êtres humains ont assigné une valeur prescriptive aux comportements punitifs eux-mêmes ; cette valorisation s’accompagne d’une obligation de punir, valable pour tous les membres du groupe.143 Or si l’exécution de la punition devient un devoir, seront punis non seulement les opportunistes mais aussi les individus qui ne punissent pas (même si par ailleurs ce sont des coopérateurs) ; il y a donc punition des non- punisseurs, ou méta-punition.144 Un bon nombre d’expériences théoriques et empiriques ont montré que le mécanisme de la punition des non-punisseurs renforce à la fois le comportement coopératif et le comportement punitif, c’est-à-dire qu’il permet de faire monter le taux moyen de coopération dans le groupe (BOYD &RICHERSON 1992 ; FEHR

&FISCHBACHER 2004a).

Toutefois, la méta-punition a également ses limites : elle est confrontée à la difficulté d’une régression à l’infini car il vaut mieux être simple punisseur de non- punisseurs plutôt que punisseur de non-punisseurs de non-punisseurs, etc. Même s’il est clair qu’elle renforce la coopération et la punition, la méta-punition ne permet pas non plus à elle seule d’expliquer l’évolution des comportements altruistes punitifs.

Un autre facteur potentiel qui a fait couler beaucoup d’encre est celui de sélection de groupe (BOYD et al. 2003 ; GINTIS 2000 ; HENRICH &BOYD 2001). A la différence de la sélection génétique de groupe (section 2.2.4), ce qui va être présenté ici est une sélection culturelle de groupe où les objets de sélection ne sont pas des stratégies comportementales génétiquement déterminées mais des stratégies culturellement transmises. Voyons dans le détail comment elle fonctionne.

142

La question de l’évolution des normes sociales et leur effet sur la coopération sera traitée à la section suivante (2.3.5).

143

Dans ce contexte, certains auteurs parlent de moralisation des normes sociales et de la punition (GINTIS 2000). Cela me paraît toutefois exagéré. Que des règles soient valorisées et associées à la punition ne signifie pas que l’on entre dans le domaine moral. Ce point deviendra plus clair au chapitre 5, section 5.4.

144

On part du principe que les êtres humains forment des groupes relativement homogènes, composés d’individus qui adhèrent à des normes sociales et les transmettent par l’imitation et l’enseignement (section 1.2.1). En accord avec les observations ethnographiques, on admet également que les normes transmises diffèrent d’un groupe culturel à un autre : deux groupes voisins peuvent posséder des normes et des institutions très différentes. Ensuite, on présuppose que les êtres humains possèdent une « tendance au conformisme » (c’est-à-dire adoptent assez facilement les normes qui ont beaucoup de succès dans leur société) et une tendance à imiter les comportements qui ont du succès ou dont les individus qui les utilisent ont du succès (voir section 1.2.3, p. 43). Ainsi, au fil des générations, on observera à l’intérieur de chaque groupe, une tendance à l’uniformisation des normes acceptées (HENRICH & BOYD 2001 ; FEHR &

FISCHBACHER 2003, p.790).

La sélection de groupe fonctionne s’il existe plusieurs groupes et si ces groupes sont suffisamment variés entre eux. Pour que ce soit le cas, deux conditions doivent être réunies. Premièrement, il faut une variation entre les normes sociales prônées dans les différents groupes ; par exemples les groupes peuvent se différencier par le fait que certains possèdent des normes sociales renforcées par la sanction et d’autres pas. Deuxièmement, il faut une influence de cette variation des normes sur la santé des groupes ; par exemple, on sait que les groupes qui possèdent des normes renforcées par la sanction se portent généralement mieux que ceux qui n’en ont pas, car ils sont plus efficaces dans la production de réserves, de moyens collectifs de défense, etc.

La sélection de groupe opère lorsqu’il y a compétition entre les groupes ; cette compétition se traduit par des guerres ou des conflits d’influence, qui se soldent soit par le dépérissement de certains groupes au profit des autres, soit par l’absorption d’un groupe par un autre ; dans ce dernier cas, les groupes vainqueurs imposent leurs normes culturelles et leurs institutions aux individus des groupes vaincus et le mécanisme du conformisme opère, au fil des générations, en faveur d’une uniformisation des normes sociales acceptées.145 Ainsi, s’il y a compétition entre un groupe qui possède des normes renforcées par la sanction et un autre qui n’en possède pas, l’issue de la compétition se soldera par un avantage du premier sur le second. En conséquence, les comportements coopératifs et de punition altruiste se répandront dans l’ensemble de la population.

145

On remarque ici la différence avec la sélection génétique ; un processus rapide d’uniformisation à l’intérieur des groupes contraste avec la rigidité de la transmission génétique.

En résumé, voici ce qui se passe pour le comportement altruiste punitif. Par définition, il est légèrement défavorable du point de vue individuel par rapport aux comportements non altruistes. Par contre, il se trouve qu’au niveau du groupe, l’existence d’individus altruistes est avantageuse puisqu’elle a pour effet d’augmenter la coopération qui permet la réalisation de projets communs d’envergure. Ainsi, si au niveau de la sélection individuelle le désavantage engendré par un comportement altruiste punitif n’est pas trop grand (les facteurs de l’efficacité de la punition et de la méta-punition agiront en ce sens), un petit effet de sélection culturelle de groupe suffit à faire pencher la balance à l’avantage de ce comportement (GINTIS 2000, p. 171).

Cette théorie de la sélection culturelle de groupe est un bel exemple de théorie de la coévolution gène-culture ; des tendances génétiquement déterminées influencent le processus d’évolution culturelle et il est probable que l’évolution culturelle de groupe a pour conséquence, sur le long terme, d’ancrer dans nos gènes des tendances psychologiques motivant à agir en faveur d’autrui (BOWLES et al. 2003).146 De plus, la

théorie de la sélection culturelle de groupe est plus crédible que son pendant génétique pour au moins deux raisons : d’une part, au niveau culturel, les groupes se font et se défont plus rapidement ; d’autre part, il est probable qu’à l’intérieur des groupes, la configuration des stratégies s’homogénéise assez rapidement (notamment grâce à la tendance au conformisme ou à la punition des non-punisseurs). Toutefois, elle implique une conséquence assez dérangeante : cette théorie fait dépendre l’évolution de l’altruisme évolutionnaire de l’existence de conflits permanents entre les groupes. Dit crûment : seule la guerre permet l’altruisme. Pour échapper à cet aspect indésirable, il vaut sans doute la peine de poursuivre la recherche de facteurs susceptibles d’expliquer la stabilisation des comportements altruistes punitifs. Le champ des nouvelles spéculations est ouvert.147

146

Cette question sera développée au chapitre 4, section 3.4.

147

Une solution serait de recourir à la réputation. Andy GARDNER et Stuart WEST (2004) par exemple soutiennent que l’ingrédient crucial pour l’évolution de la punition (et avec elle de la coopération) est une corrélation entre la stratégie punitive adoptée par un individu et la coopération qu’il reçoit en retour. Par exemple, si un individu est connu pour ses propensions à punir les opportunistes, par peur de la punition, les autres auront tendance à choisir de coopérer avec lui. Mais dans ce cas, la punition ne peut plus être qualifiée d’altruiste ! D’autre part, même en admettant l’impossibilité de l’évolution de la punition altruiste, cette explication n’est pas entièrement convaincante car elle dépend de contextes où la condition

Il va sans dire que de par leur aspect spéculatif, les modèles de la seconde génération de la théorie des jeux doivent être considérés avec précaution.148 De plus, quoique déjà très raffinés, ils ne représentent que de manière imparfaite la complexité des relations humaines. Nous ne sommes par exemple jamais entièrement opportunistes et distribuons nos bienfaits et nos punitions de manière conditionnelle en fonction de critères plus complexes que la simple connaissance des actions passées des autres individus. Or ces finesses peuvent difficilement être modélisées. Ainsi, la théorie des jeux ne peut au mieux que révéler le fonctionnement et les implications de mécanismes très généraux.

Cela dit, on ne peut nier un apport important des études menées sur la réciprocité indirecte et l’altruisme fort : elles montrent à quel point la punition est un facteur crucial pour le maintien de la coopération.149 Certains résultats sont sans appel : sans punition, la coopération cesse rapidement et lorsque la punition des opportunistes est possible, la coopération est plus stable (BOYD et al. 2003 ; FEHR &FISCHBACHER 2003).150 De plus,

la punition altruiste permet d’augmenter le taux de coopération, même dans le cadre de grands groupes (BOYD & RICHERSON 1992 ; FEHR & GÄCHTER 2002 ; FEHR &

FISCHBACHER 2004a).151

d’anonymat est levée et le retour de service possible ; or les expériences montrent que beaucoup de sujets humains sont disposés à punir alors même que ces conditions ne sont pas remplies (GINTIS et al. 2003).

148

Par exemple, il n’est pas évident de comprendre comment une stratégie punitive qui apparaît pour la première fois dans une population peut s’y propager ; en effet, même si la punition est peu coûteuse pour les individus qui la pratiquent dès lors qu’elle est suffisamment dissuasive, elle est en revanche très coûteuse pour les premiers altruistes punisseurs qui apparaissent dans une population peu coopérative. De nouveaux modèles ont récemment été développés pour résoudre cette question : FOWLER 2004 ; BOWLES &GINTIS 2004.

149

Certains auteurs objectent que les comportements punitifs n’ont pas évolué parce qu’ils permettent de favoriser la coopération mais plutôt parce qu’ils ont pour effet de contraindre les opportunistes, c’est-à- dire de niveler les inégalités (M. PRICE et al. 2002). Il est difficile de savoir quel crédit accorder à cette objection, d’autant plus qu’il semble que la punition produise ces deux effets de manière conjointe. Peut- être faudrait-il considérer ces deux approches comme complémentaires en accordant une double fonction à la punition.

150

Elle est cependant mise en péril lorsque les groupes deviennent trop grands (au-delà de 100 personnes).

151

La question de savoir si la punition est un mécanisme qui permet l’évolution ciblée de comportements altruistes (FOWLER 2004) ou de n’importe quel comportement (BOYD &RICHERSON 1992) reste débattue.