• Aucun résultat trouvé

Formalisation et opérationnalisation des processus d’ac- d’ac-cumulationd’ac-cumulation

Parcours de vie et effets cumulés

1.2 Matthew effect et effets cumulés

1.2.2 Formalisation et opérationnalisation des processus d’ac- d’ac-cumulationd’ac-cumulation

Le concept d’effets cumulés est en fait un terme générique pour plusieurs pro-cessus différents qui se basent sur la même idée : au cours du temps, un individu

ou un groupe accumule des avantages, ou des désavantages, par rapport à un autre individu ou un autre groupe, ce qui crée un accroissement de l’inégalité. Il reste encore à définir comment cette accumulation se produit, c’est-à-dire quelle est la forme du processus à l’œuvre dans un éventuel accroissement des inégalités. En effet, un travail conséquent a été fourni dans la définition des processus d’accu-mulation d’avantages ou de désavantages d’un point de vue théorique (Dannefer, 2009), mais la question de l’opérationnalisation de ces processus a moins attiré l’at-tention des chercheurs. Dans un article capital sur les avantages et les désavantages cumulés, DiPrete et Eirich (2006) proposent de formaliser les différents processus souvent évoqués en sciences sociales sous le nom de processus d’effets cumulés, mais qui ne sont que rarement explicités de manière précise. Pour reprendre la classifica-tion proposée par DiPrete et Eirich (2006), l’identificaclassifica-tion d’un processus d’effets cumulés est possible à partir de trois critères.

Le premier concerne uniquement à la forme de la distribution de la variable d’in-térêt : une distribution étalée à droite serait le signe d’une accumulation d’avantage.

Une forme de ce type indique en effet une répartition inégalitaire d’une ressource quelconque, avec un grand nombre de personnes en possédant peu, ceux qui se trouvent à gauche de la distribution, et un nombre de plus en plus petit de per-sonnes qui en possèdent beaucoup. C’est notamment le genre de distribution que l’on retrouve pour des variables telles que le nombre de citations pour des scien-tifiques (Price, 1976). Une forme connue de ce type de distribution est la « loi de puissance » (power law) car la probabilité de mesurer une valeur particulière de la variable dépendante varie de manière inverse à la puissance de cette valeur, ce qui s’exprime formellement comme p(x) =Cx−α (Newman, 2005). Cette « loi de puissance » est un moyen de décrire efficacement certains phénomènes dans des domaines très différents allant de la physique à la sociologie (Newman, 2005). Il permet de représenter assez bien le phénomène des « rising stars » scientifiques décrits par Merton (1968, 1988) et de manière plus générale le « Matthew effect ».

Dans ces cas, le résultat du processus d’accumulation d’avantages produit une dis-tribution, respectivement, des citations et de la richesse, fortement inégalitaire.

Le cas de la santé est en revanche plus compliqué ; si ce type de distribution pourrait représenter la répartition de la santé dans la population, avec cette fois les valeurs extrêmement négatives comme valeurs rares, sa forme ne peut pas être considérée comme le résultat direct d’un processus d’accumulation de désavantages.

Il est en effet difficile d’imaginer la santé comme une ressource qui s’accroît avec le temps. Il est plus pertinent de considérer la santé comme une ressource qui décroît avec le temps, mais à des taux différents pour les individus.

La présence de ce type d’accumulation de désavantages a été mis en évidence dans plusieurs études (Ross et Wu, 1996; Ferraro et Kelley-Moore, 2003; Zim-mermann et al., 2006; Willson et al., 2007). Cela démontre en revanche que cet indicateur d’un processus d’effets cumulés est sujet à caution, en particulier lors-qu’il est appliqué à la population dans son ensemble. De plus, pour représenter une distribution sous la forme d’une loi de puissance, il est nécessaire que la variable d’intérêt soit quantitative, ce qui rend impossible l’utilisation de variables ordinales pourtant souvent présentes en sciences sociales (par exemple pour représenter l’état de santé, la classe socio-professionnelle, le niveau d’éducation etc.).

Une deuxième manière d’identifier un processus d’accumulation d’avantages ou

de désavantages est de s’intéresser à la croissance de l’hétérogénéité d’une caracté-ristique dans une population. Ceci rejoint la définition de base des effets cumulés proposée par Dannefer (2003), mais comme pour l’étude de la forme de la distri-bution, ceci suppose d’avoir une variable quantitative pour pouvoir en calculer la variance, ou alors d’utiliser l’entropie ou d’autres mesures de diversité applicables à des données catégorielles. De plus, cette méthode ne permet pas de comparer facilement l’évolution de la variance suivant certains groupes et de faire ainsi des hypothèses sur les avantages ou désavantages relatifs d’un groupe sur un autre.

La troisième manière de faire proposée par DiPrete et Eirich (2006), et celle sur laquelle nous nous concentrerons, consiste à formaliser le processus d’effets cumulés comme une équation de régression. Plusieurs modèles sont envisageables, suivant la façon d’envisager le processus d’accumulation et le niveau de complexité que l’on admet. Le type d’accumulation le plus basique que l’on puisse envisager est un processus similaire à celui d’un intérêt composé dans lequel la valeur au temps t d’une variable y pour l’individu i, avec i va de 0 à N, dépend de sa valeur au tempst= 0 et d’un taux d’accroissementλconstant dans le temps. Formellement, on obtient la formule de l’intérêt composé :

yit=yi0(1 +λ)t, (1.1)

avec i va de 1 jusqu’à N le nombre total d’individus, et t va de 0 jusqu’à T le nombre total de périodes. Cette vision de l’accumulation est évidemment très simplifiée, puisqu’on ne suppose ni de termes d’erreur, ni de taux de croissance contrôlé par d’autres variables explicatives. Heureusement, il existe des types de modèle qui permettent de rendre compte de manière plus appropriée de la com-plexité inhérente à des processus sociaux. Il est important de mettre en évidence la différence principale entre ces modèles et les modèles d’accumulation de risques ou d’enchaînement de risques présentés plus haut. Nous nous sommes jusqu’à présent intéresser à l’accumulation d’effet sous la forme d’enchaînement ou d’accumulation de risques ; dans les modèles suivant, nous nous intéressons plus particulièrement aux effets des processus d’accumulation de risques sur les inégalités croissantes entre groupes. Nous nous intéresserons plus particulièrement à deux ensembles de processus et à la formalisation qui leur sont associés.

Avantage cumulé « path dependent »

Le premier type de modèle correspond à ce que DiPrete et Eirich (2006) ap-pellent « path-dependent cumulative advantage »et qui est celui qui se rapproche-rait le plus du processus postulé en sciences sociales par Merton dans le cadre de la production d’articles scientifiques (Merton, 1968, 1988). Ce processus est égale-ment proche du mécanisme des intérêts composés ou encore de la notion de capital humain que l’on retrouve dans l’équation de Mincer. Ce processus implique que, à chaque temps t, la valeur de la variable d’intérêt soit dépendante de sa valeur au temps précédent. Plus concrètement, ce type de processus nécessite qu’à chaque temps t, l’état de l’individu au temps t−1 soit inclu dans la prédiction de son état. Ainsi, dans une perspective d’accumulation d’avantages ou de désavantages, la quantité croît exponentiellement même avec un taux d’accumulation constant puisque la quantité à laquelle il s’applique augmente à chaque moment de mesure,

pour autant que le coefficient de croissance soit positif. DiPrete et Eirich (2006) utilisent à ce sujet une comparaison entre ce type de croissance exponentielle et la croissance purement arithmétique de la distance parcourue par un coureur de fond : la distance parcourue à chaque instant ne dépend que de sa vitesse et de la durée de course, et pas de la distance déjà accumulée. De manière formelle, l’opération-nalisation de ce processus d’accumulation se traduirait par un modèle comportant un processus auto-régressif (la valeur au temps t est régressée sur elle-même au tempst−1) (Eq. 1.4).

yit = β0+yi,t−1+β1yi,t−1+β2xit+it, (1.2) yit = β0+ (1 +β1)yi,t−1+β2xit+it (1.3)

i = 1...N t = 1...T.

Dans ce modèle, l’effet d’accumulation est spécifié dans le coefficientβ1; plus ce coefficient sera élevé, plus la valeur de y au temps précédent aura un impact important sur y au temps t. Notons que contrairement au modèle très simple de l’équation 1.1, ce type de modèle permet de contrôler le taux d’accroissement par les variables exogènesxit.

Dans cette vision des effets cumulés, le processus est dû aux ressources à dis-position et aux bénéfices qu’elles génèrent pour l’individu, en terme de santé, de statut social, de revenu ou d’autres indicateurs sociaux. Ici, c’est principalement ce coefficientβ1qui détermine le rendement généré par la ressource.

Accumulation dépendante du statut

Le deuxième type de processus, nommé par DiPrete « status-dependent », a été étudié pour la première fois en sociologie par Blau et al. (1978). Alors que dans le premier type de processus, l’effet d’accumulation se trouve principalement dans la relation entre la valeur au temps précédent et la valeur actuelle de la variable dépendante, dans ce deuxième type de processus, l’accroissement dépend principalement d’un statut, qu’il soit constant à travers le temps, comme le sexe ou la cohorte, ou variable, comme le niveau d’éducation ou la catégorie socio-professionnelle. L’idée principale, pour faire le lien avec la définition de Dannefer des effets cumulés, est de chercher à expliquer une part de l’hétérogénéité non-observée dans l’évolution d’une variable dépendante. En d’autres termes, on considère une tendance générale de l’évolution (dans le cadre de la santé il y a par exemple une tendance générale à la dégradation) et on cherche à comprendre pourquoi certains individus, toutes choses égales par ailleurs, dévient de la tendance générale. En cherchant à identifier quels sont les groupes, les groupes se définissant ici par la notion de « statut », qui permettent d’expliquer l’hétérogénéité non-observée de la tendance générale. De manière plus formelle, tout en ne spécifiant pas encore un modèle statistique directement exploitable (ce qui sera fait dans le chapitre 6), le modèle suivant ne représente que l’évolution d’une variable à travers le temps, avec le statutsi, variable dichotomique, comme variable indépendante (Eq. 1.4).

yit=β0+β1tit+β2si+it. (1.4)

L’évolution dey avec le temps, et donc sa pente, est représenté dans ce modèle par le coefficientβ1; on a ici la tendance moyenne de l’évolution dey, et le coefficient β2représente l’écart moyen, constant au cours du temps, entre les droites pours= 0 et s = 1. Comme nous l’expliquions plus haut, chercher à identifier un processus d’effets cumulés de type « status-dependent » consiste à évaluer si l’évolution dey diffère entre les deux statuts représentés pars. Cette différence de pente entre les statuts se représente comme dans l’équation 1.5.

yit=β0+β1tit+β2si+β3si·tit+it. (1.5) Dans ce modèle, l’ajout d’une interaction modifie l’interprétation de l’effet prin-cipal du temps,β1. Ce coefficient représente désormais l’évolution deyavec le temps pour les individus dont le statut svaut 0. La différence de pente entre les indivi-dus de statut 0 et les indiviindivi-dus de statut 1 est représentée par le coefficient β3

de l’interaction entre le statut et le temps ; si ce coefficient est significativement différent de 0, il y a une différence de pente entres= 0 ets= 1 qui se traduira par une divergence croissante dans le temps. Si cette interaction n’est pas significative, on ne peut pas dire que les deux pentes soient significativement différentes, et par conséquent, il n’y a pas de divergence significative au cours du temps. La figure 1.3 présente de manière graphique cette divergence dans le temps.

t y

s=0 s=1 β

β * t

0 2

3

Figure1.3 – Interaction statut-temps

Nous ne nous sommes intéressés ici qu’à une forme de relation linéaire entre la variable dépendante et le temps. Il est possible de spécifier d’autres relations au temps, comme une relation quadratique ou cubique, simplement en utilisant une transformation de notre variable de temps. Un modèle dit « piecewise » est égale-ment envisageable en découpant le temps en plusieurs classes et en les introduisant comme des variables indicatrices ; ainsi, un coefficient est associé à chaque période, ce qui permet de prendre en compte des formes fonctionnelles complexes.

A notre connaissance, ce type de modèle n’a été exploité que par Willson et al.

(2007) dans leur étude sur les avantages cumulés comme explication des inégalités de santé aux Etats-Unis. Il subsiste malheureusement dans cet article une certaine

confusion entre les différents mécanismes d’accumulation d’effets : alors que les auteurs testent clairement un modèle de type « status-dependent », puisqu’ils s’in-téressent à l’effet de l’interaction entre l’âge et certaines variables « fixes » dans le temps comme le sexe ou la cohorte de naissance, ils déclarent estimer un modèle

« path-dependent ». Comme nous l’avons vu plus haut, et comme DiPrete et Eirich (2006) l’ont clairement établi, un modèle « path-dependent » nécessite l’inclusion d’un effet lag pour prendre en compte le « chemin » qui conduit à la valeur de la variable dépendante au tempst.

Comme on le voit dans la spécification, la variable dépendantey varie avec le temps. Même s’il est possible de spécifier le même modèle sur des données trans-versales, comme c’est le cas par exemple dans l’article sur les effets cumulés de l’éducation sur la santé de Ross et Wu (1996), cela impose des limitations. Ce modèle postule que l’accumulation d’avantages ou de désavantages se situe dans l’interaction constante du statut de l’individu avec des structures sociales. Le sta-tut qui définit l’individu évolue tout au long de son parcours de vie et peut se modifier en raison de la tendance systémique, ce qui correspondrait à un proces-sus d’accumulation d’effet et à la définition qu’en fait Dannefer (1987). Mais il est également important de prendre en compte l’aspect unique et individuel que revêt chaque parcours de vie et son agencement imprévisible d’événements qui peuvent le ponctuer. C’est pour cette raison que nous avons introduit également le concept d’événements de vie, car c’est à travers leur introduction dans un modèle d’accu-mulation d’effets que nous pourrons isoler, en partie, les processus d’accud’accu-mulation des perturbations engendrées par des événements. Nous reviendrons sur ce point important d’ici peu.

Accumulation dépendante de la durée d’exposition

Une autre manière d’envisager un processus d’accumulation d’effets est de consi-dérer la durée d’exposition d’un individu à un facteur de risque. Ce type d’influence a été évalué par exemple par McDonough et Berglund (2003) dans leur étude sur l’influence de l’exposition à des périodes de pauvreté sur les trajectoires de santé.

Ce type de modèle est proche du type de modèles parfois utilisés en épidémiologie et qui cherchent à évaluer l’impact sur le risque de développer une maladie en fonc-tion de la durée d’exposifonc-tion à un agent. En revanche, l’épidémiologie se préoccupe davantage d’agents physiques, tels que l’amiante, plutôt que d’agents que l’on pour-rait qualifier de sociaux. D’un point de vue statistique, l’évaluation de l’influence de la durée d’exposition ne pose pas de difficultés majeures, pour autant que l’on dispose des données nécessaires sur le parcours de vie des individus. McDonough et Berglund (2003) ont par exemple utilisé des variables dichotomiques pour dis-tinguer les individus n’ayant pas vécu de périodes de pauvreté des individus ayant vécu pendant 1 à 7 ans ou plus de 8 ans de pauvreté.

Evénements et processus

Les modèles exposés précédemment s’intéressent en particulier à la part systé-matique dans l’évolution de la variable dépendante, et ne considèrent pas l’impact d’événements, dus au hasard ou pas, sur cette évolution. Une trajectoire de vie est cependant soumise, en plus des tendances systémiques décrites par les modèles

d’effets cumulés, aux aléas des décès, des accidents, des maladies, des périodes de chômage, etc. L’occurrence de ces événements peut parfois être modélisée si l’idée de les prédire est sensée ; le reste du temps, ces événements sont exogènes. Par exo-gène, nous entendons qu’ils ne sont provoqués ni par la structure sociale, ni par la structure du parcours de vie individuelle, ni par le libre arbitre de l’individu, mais simplement par des concours de circonstances qui échappent à toute régularité. Il nous semble qu’il est important de prendre en compte ce type de perturbations dans le modèle car elles peuvent, sans faire partie de l’explication du processus, avoir un impact énorme qui se doit d’être contrôlé. Pour ajouter cette dimension événemen-tielle aux modèles opérationnels définis plus haut, nous proposons d’intégrer des indicateurs des événements survenant à chaque unité temporelle et qui permettent deux choses : premièrement contrôler les éventuelles perturbations causées par des événements exogènes, deuxièmement évaluer l’impact réel de ces événements sur la variable dépendante. De plus, en ajoutant une interaction entre ces indicateurs et la variable définissant le temps, il est possible d’estimer le rôle de la temporalité dans l’impact de l’événement. Nous reprenons le modèle précédent et y ajoutons deux paramètres :β4qui contient l’effet d’un événement représenté par une variable binaireeit, et β5 qui contient l’interaction entre le temps et l’événement (Eq. 1.6).

yit=β0+β1tit+β2si+β3sitit+β4eit+β5eittit+it (1.6) Postulons maintenant que ces deux coefficients sont positifs et significatifs. Le fait queβ4soit significativement supérieur à zéro nous indique qu’au temps de référence (c’est-à-dire pourt= 0), l’événement a une influence significative suryit. Le fait que β5 soit supérieur à zéro nous indique que pour chaque unité de tsupplémentaire, l’effet de l’événementeest la somme entreβ4et β5t. On peut alors en conclure, si on considère que t représente l’âge et queβ5 est positif, que plus les individus vieillissent, plus l’événementea un impact sur la variable dépendantey.