• Aucun résultat trouvé

Pourquoi, comment et quand pondérer en comparaison internationale ?

Dans le document À Dominique et Antoine 1 (Page 97-103)

Les méthodes d’analyse statistique reposent sur une conception probabiliste de la causalité : la présence d’une cause conduit à une certaine probabilité d'apparition de l’effet. L’effet se produira souvent, mais il ne se produira pas toujours. Cette conception est opérationnalisée avec le concept de fréquence. C’est quand une association se retrouve fréquemment qu’on peut l’interpréter comme une causalité. Ce concept de fréquence nécessite donc des échantillons statistiquement représentatifs. C’est pourquoi cette conception se retrouve plus dans les analyses statistiques que dans les enquêtes qualitatives. À la conception probabiliste selon laquelle la présence de la cause conduira souvent à l’effet, on peut opposer une conception déterministe de la causalité selon laquelle la présence d’une cause conduit toujours à l’effet. La conception déterministe se retrouve plutôt dans les analyses qualitatives où ce n’est pas la fréquence qui est importante, mais l’existence d’un cas. Les cas atypiques ne sont pas éliminés – comme dans certaines analyses quantitatives où ils reçoivent le qualificatif peu flatteur de valeurs aberrantes –, mais sont justement étudiés pour leur originalité. C’est le recours à la logique plutôt qu’à la fréquence qui rend pertinente une analyse sur base d’échantillons non strictement représentatifs – au sens d’aléatoires –, mais qui comprennent toujours une diversité de cas. La méthode qualitative de la saturation reflète bien l’importance de l’existence plutôt que de la fréquence : c’est quand on ne découvre plus de nouveaux cas qu’on s’arrête dans la récolte d’informations. Ce débat oppose donc deux logiques fondamentalement différentes : celle de la fréquence d’une association et celle de l’existence d’une

association.

Ce raisonnement « fréquentiste »81 implique que chaque observation statistique ait un poids : plus son poids est élevé par rapport aux autres observations, plus elle pèsera sur le sens et l’ampleur de l’association mathématique observée. Même quand ce poids est identique pour toutes les observations – et qu’il passe inaperçu –, il existe. Dans ce cas, le chercheur émet l’hypothèse (implicite et très souvent logique) que chaque individu de l’échantillon se vaut. Et cela est valable pour tout raisonnement « fréquentiste », qu’il s’agisse d’une inférence analytique, d’une inférence descriptive ou d’une description exhaustive. Au contraire, dans le raisonnement « existentialiste »82

81 Notez que le terme fréquentiste utilisé ici n’a rien à voir avec la conception fréquentiste des probabilités (les probabilités sont estimées a posteriori par la fréquence de l’occurrence de l'événement d’intérêt, après la répétition presque infinie de la possibilité d’apparition de l’événement) opposée à la conception bayésienne des probabilités (c’est-à-dire l’appréciation « subjective » a priori de la possibilité de réalisation d’un événement).

82 Ici aussi, le terme « existentialiste » n’a rien à voir avec la philosophie de l’existentialisme. Les termes de déterministes et de probabilistes auraient pu être utilisé à la place de ceux d’existentialiste et de fréquentiste, mais ils présentent l’inconvénient d’évoquer le débat philosophique de la liberté humaine. Or, ces deux oppositions sont des oppositions méthodologiques dans la manière de constater la cause qui n’ont pas de rapport avec la question du libre arbitre de l'être humain. En réalité, ces deux approches, parce qu’elles postulent des mécanismes causaux, s’intègrent plutôt, et de manière équivalente, dans la philosophie déterministe.

les observations n’ont pas de poids83. Dans le cas d’une inférence descriptive, il arrive que l’on doive pondérer (c’est-à-dire considérer que certaines observations de l’échantillon valent plus que d’autres) quand l’échantillon n’est pas parfaitement représentatif. Le chercheur peut avoir délibérément sur-représenté certains groupes minoritaires qui l’intéressent particulièrement, par exemple, les pauvres, les précaires ou les riches. Dans ce cas, ces observations se verront attribuer un poids réduit pour corriger leur sur-représentation dans l’échantillon par rapport à la population. Il est aussi possible que la sur-représentation découle d’une variation du taux de réponse selon différentes catégories de répondants. Dans ce cas, la pondération permet de corriger les biais dus à un processus d’échantillonnage inévitablement imparfait. Selon l’approche de l’inférence analytique, l’utilisation de la pondération est moins souvent recommandée. En effet, si le processus d’échantillonnage n’a aucun rapport avec le mécanisme social étudié, alors, pondérer ne sert à rien, comme nous l’avons vu84. Évidemment, tout comme la logique de l’inférence analytique est construite sur une fiction, il est impossible de vérifier empiriquement cette absence de relation. C’est pourquoi même dans une logique d’inférence analytique, il est possible d’utiliser la pondération provenant du processus d’échantillonnage.

Dans notre cas, ce processus d’échantillonnage n’existe pas. Il faut donc rechercher ailleurs une base théorique pour justifier la pondération. Il est possible de simplement attribuer un poids égal à chaque pays à partir du postulat selon lequel chaque pays se vaut (autrement dit, que les pays sont égaux). Cependant, on peut remarquer que les pays peuvent « instantanément » fusionner ou se scinder85. Les exemples de la réunification allemande en 1992 et de la dissolution de la Tchécoslovaquie en 1993 témoignent d’une transformation instantanée (presque « magique ») de l’« échantillon » des pays européens.

Pour avancer sur cette question, il est intéressant de se poser la question de ce qu’est un pays (ou un État). Un apport instructif provient du droit international qui énumère trois éléments constitutifs fondamentaux de l’État (Crawford 1977) : le territoire, la population et le gouvernement. Ainsi, un pays, c’est à la fois un territoire physique, une population y résidant et des institutions politiques y exerçant un pouvoir. Chacun de ces aspects permet d’entrevoir une approche différente du pays et un vocabulaire associé spécifique. Quand on s’intéresse à un pays pour son territoire, on peut parler d’approche géographique, et le terme qui vient plus directement à l’esprit est celui de pays. Quand on s’intéresse à un pays pour sa population, on peut qualifier l’approche de sociologico-démographique, ce sont les termes de nation, de peuple et d’habitants qui expriment mieux l’objet

83 Dans un raisonnement « existentialiste », on ne peut même pas dire que chaque observation a un poids équivalent : la notion même de poids n’y a pas de sens. Basé sur l’existence d’un phénomène et non sa fréquence, plutôt que le poids, ce sont les questions de la véracité, de l’exactitude de la description ou de la pertinence de la classification du phénomène étudié qui sont centrales.

84 C’est le sens central de la phrase précitée « if the model is true and the sampling mechanism is independant of the residuals in the probability model, then the sampling design is irrelevant and taking account of the sampling design entails a loss of efficiency » (Snijders et Bosker 2011, 219).

85 Il est vrai que les personnes meurent et naissent, mais ce sont des processus très différents des annexions et scissions d’États. En effet, la naissance, qui marque l’apparition d’un nouvel être humain, et la mort, sa disparition, sont toujours des ruptures. Pour les États, au contraire, ces transformations s’inscrivent plus dans la continuité (même si les changements, et parfois la violence, peuvent être présents) : les infrastructures sont conservées, les dettes réparties, les actes juridiques précédents subsistent, les territoires et populations antérieures continuent d’exister... En réalité, les États sont des entités moins cloisonnées que les individus puisque leurs frontières peuvent varier au cours de l’histoire.

d’étude. Enfin, quand on s’intéresse aux institutions, on peut parler d’approche politico-juridique, dans ce cas, on parlera plus facilement d’État – même si des institutions para-étatiques telles que les lieux de concertation sociale peuvent faire partie de cette approche.

Ainsi, dans une approche géographique, il peut être pertinent de pondérer les pays selon leur superficie – les grands pays sont alors les pays vastes. Dans une approche sociologico-démographique, il est pertinent de pondérer les pays selon leur population – les grands pays sont les pays très peuplés. Dans une approche sociologico-juridique, étant donné qu’il n’existe pas de poids naturel86, il me semble préférable d’attribuer un poids égal à chaque pays. D’autres pondérations sont imaginables : par exemple, le poids économique du pays dans les échanges mondiaux ou la longueur des côtes... Mais dans la très grande majorité des études de sciences sociales, on s’intéresse aux pays pour leurs populations ou pour leurs institutions.

Notez que cette question de la pondération a des implications importantes quand on s’intéresse aux pays européens. En effet, ils présentent des variations de populations très importantes : par exemple, la population allemande est plus de 160 fois plus nombreuse (plus de 80 000 000 d’habitants) que la population maltaise (moins de 500 000 habitants).

Cette pondération par la population se justifie particulièrement dans les comparaisons internationales traitant des inégalités. En effet, quand on s’intéresse aux inégalités sociales, les pays sont considérés en raison de leur population. C’est l’inégale distribution du revenu – ou les rapports hiérarchiques – au sein de la population qui intéresse le chercheur, et non les caractéristiques étatiques (son caractère fédéral ou unitaire, sa tradition juridique, etc.) ou physiques (superficie, etc.) du pays – même si certaines de ces caractéristiques peuvent expliquer l’ampleur des inégalités, leur utilisation ne vient que dans un second temps, c’est-à-dire après avoir décrit et mesuré les inégalités au sein de la population. En outre, comme nous venons de le voir, la pondération par la population présente l'avantage de limiter les artefacts en cas de sécession ou de réunification de certains pays. Dans notre cas, il m’a semblé préférable de pondérer à partir de la population active occupée de chaque pays parce que je travaille sur l’inégalité entre travailleurs et non sur l’inégalité au sein de l’ensemble de la population. Pour ce faire, j’ai utilisé la moyenne du nombre d’actifs occupés (mesurés par l’enquête sur les forces de travail) pour les années 2003 à 200987. Ceci dit, dans les pays européens, les différences de taux d’emploi étant bien inférieures aux différences de population, l’utilisation de la population totale pour la pondération n’aurait probablement pas changé grand-chose.

Par ailleurs, l’utilisation de la pondération peut se justifier également dans une perspective d’inégalité totale, c’est-à-dire entre et à l’intérieur des pays (Firebaugh 2000). En effet, l’ensemble des inégalités salariales en Europe se décompose en une somme de deux termes : l’inégalité entre les pays (inter-nationale) et l’inégalité à l’intérieur des pays (intra-nationale). La première concerne les écarts entre les salaires (moyens) des différents pays européens. La seconde concerne les écarts au sein des pays, ce qui est l’objet de cette thèse. Dans cette perspective, il existe une inégalité intra-nationale totale : la somme de l’inégalité intra-nationale de tous les pays.

86 Ce choix est un peu bancal, puisque rien ne permet de dire que les institutions de chaque État se valent... Mais cette critique est vraie pour les autres : est-ce que chaque habitant se vaut ou est-ce que chaque km² se vaut ? À défaut d’une justification de l’inégalité, il me semble préférable de considérer que chaque institution, chaque habitant et chaque km² se valent.

Cette décomposition entre inégalité intra-pays et inter-pays se présente comme une décomposition classique de la variance telle qu’elle se présente dans une analyse de variance88 : la variance totale équivaut à la somme de la variance entre les groupes et de la somme des variances interne à chaque groupe. Dans ce cas, les groupes sont bien entendu les pays. Comme cette équivalence n'est vraie que pour des variances, le coefficient de Gini est souvent abandonné pour la variance du logarithme du revenu89. Cette dernière mesure est préférée à la simple variance du revenu parce qu'elle permet de neutraliser l'unité de mesure du revenu (la monnaie utilisée). De plus, comme nous le verrons en détail au chapitre XVI, utiliser le logarithme du revenu ou du salaire permet de transformer une distribution asymétrique en une distribution plus proche d'une loi normale.

Si, au niveau mondial, l’inégalité entre pays est certainement plus importante que l’inégalité au sein des pays90, surtout depuis le début de la révolution industrielle91, au niveau de l’Europe les disparités entre pays sont moins importantes. Le graphique et le tableau suivant permettent de quantifier cette inégalité entre pays. Le graphique VIII.1 compare simplement les salaires médians nationaux. Le salaire y est exprimé en Euros. Pour les pays n'utilisant pas cette monnaie, le taux de change moyen de l'année est utilisé pour convertir la monnaie nationale en euros92. On y observe

88 C’est le même principe de décomposition de l’inertie (c’est-à-dire la variance multidimensionnelle) qui est à l’œuvre dans la méthode de classification ascendante de Ward, qui distingue l’inertie intra-groupe et inter-groupe, et regroupe progressivement les individus de manière à minimiser à chaque étape l’accroissement de l’inertie intra-groupe (Lebart, Piron, et Morineau 2006).

89 Le coefficient d'Atkinson convient également comme mesure (Shorrocks 1980).

90 Mais paradoxalement, elle est moins étudiée que les inégalités à l'intérieur des pays. Trois facteurs peuvent l'expliquer (Firebaugh 2000). Premièrement, elles sont méthodologiquement plus simples à aborder. En effet, seule la comparaison historique, qui nécessite des données longitudinales, est possible quand on veut identifier des facteurs explicatifs de l'inégalité inter-nationale. Par contre, quand on s'intéresse aux inégalités intra-nationales, il suffit de comparer la situation de différents pays à un moment donné. Deuxièmement, les politiques de redistribution sociale – qui sont intrinsèquement liées à la question des inégalités – ont toujours été mises en œuvre au niveau national et jamais au niveau mondial ou international. Troisièmement, les inégalités inter-pays sont plus supportables psychologiquement parce que plus éloignées géographiquement et socialement.

91 Même si la tendance récente (depuis les années 1980) semble s’inverser, l’inégalité entre nations reste plus importante que l’inégalité à l’intérieur des nations (Goesling 2001). Selon cet auteur, la part de l'inégalité inter-pays de revenu vaut entre 60 % et 85 % de l'inégalité totale (mondiale).

92 Les autres analyses présentées ultérieurement utiliseront aussi l'euro (converti selon le taux de change moyen de l'année) pour mesurer le salaire dans les pays n'utilisant pas la monnaie unique.

Graphique VIII.1: Salaire brut mensuel médian dans les pays européens (SILC 2010)

R ou m an ie B ul ga rie Li tu an ie Le tt on ie H on gr ie P ol og ne E st on ie S lo va qu ie Tc qu ie P or tu ga l S lo ni e M al te G ce C hy pr e E sp ag ne Is la nd e R oy au m e-U ni A lle m ag ne F ra nc e Ita lie Irl an de A ut ric he S de F in la nd e P ay s-B as Lu xe m bo ur g D an em ar k B el gi qu e N or ge 0 1000 2000 3000 4000 S a la ir e b ru t m é d ia n m e n s u e l ( e n )

des différences importantes, qui correspondent à la logique géographique des répartitions des richesses en Europe. Les pays d'Europe de l'Est et du Sud sont plus pauvres (et ont donc des salaires médians plus faibles) que les pays d'Europe du Nord-Ouest. Ces différences sont très importantes puisque le salaire médian norvégien vaut 15 fois le salaire médian roumain.

Une autre manière d'évaluer l'importance des inégalités est de calculer le coefficient de corrélation intra-classe (Snijders et Bosker 2011, chap. 3). Cet indicateur mesure la proportion de la variance totale (c'est-à-dire de l'ensemble de la population européenne) qui relève de la variance entre pays. Cet indicateur mesure également la corrélation entre entre deux observations tirées aléatoirement d'un même pays, tiré lui aussi aléatoirement. Ce qui explique son nom. Cette mesure peut être tirée d'une analyse de variance ou d'une régression multi-niveau sans variables explicatives. Le tableau VIII.1 montre quatre coefficients intra-classes, selon le fait qu'ils soient calculés directement sur le salaire (total) ou sur le logarithme du salaire et que les calculs aient été pondérés ou non. On observe des résultats assez différents selon le mode de calcul : travailler directement sur le salaire ou avec des données pondérées réduit le coefficient de corrélation. Le premier phénomène s'explique par le fait que les distributions nationales sont asymétriques et comprennent quelques très hauts salaires qui augmentent largement la variance interne aux pays. Or, la transformation logarithmique permet de « recentrer » ces très hauts salaires. Le second phénomène s'explique probablement par le fait que la pondération permet non seulement de corriger les biais liés aux différences de taux de réponse et aux sur-représentations volontaires, mais aussi d'ajuster le poids des répondants pour que les pays soient représentés en fonction de leur population. Or, dans l'Union européenne, les pays riches du nord-ouest (pour lesquelles les inégalités entre pays sont moindres) présentent un poids démographique majoritaire.

Mais venons-en à la valeur de ces coefficients. Situés autour de 0,2593, ces chiffres sont à la fois élevés et limités. Ils sont élevés parce qu'ils témoignent des écarts importants entre pays européens. Mais ils sont limités parce qu'ils montrent quand même que la majorité des écarts salariaux se trouvent à l'intérieur des pays94. Il n’est donc pas superflu d’étudier l’inégalité au sein des pays européens. Cependant quand on considère cette inégalité interne aux pays comme une composante de l’inégalité globale, il est fondamentalement nécessaire de pondérer les pays par leur population. En effet, l’absence de pondération pose problème dans la perspective d’une inégalité globale parce qu’elle surreprésente les habitants des plus petits pays par rapport à ceux des grands. Dans la

93 Le coefficient pondéré calculé sur le logarithme me semble le plus pertinent, puisqu'il permet à la fois de tenir compte des équilibres démographiques et de travailler sur une variable dont la distribution est proche d'une normale. 94 Je ne positionne pas ici sur la justification de ces écart. Cette question étant éminemment politique, il est tout à fait possible de justifier tant certains écarts internes aux pays (différences de productivité, de qualification...) qu'entre pays (différences de niveau de vie...).

Tableau VIII.1: Coefficients de corrélation intra-classe (intra-pays) pour les salaires bruts en Europe (année 2010)

Variable d'intérêt Pondéré Non-pondéré Salaire total 0,119 0,191 Logarithme du salaire 0,244 0,252 Type de coefficient de

logique d'une inégalité globale, c'est l'inégalité entre toutes les personnes qui compte95. Autrement dit, d’un point de vue philosophique, il est pertinent dans une étude des inégalités de partir d’un axiome stipulant que chaque individu (personne) se vaut plutôt que de l’axiome stipulant que chaque pays (État) se vaut.

95 Ainsi, Firebaugh (2000, 331) écrit : « sociologists generally study between nation income inequality because of what it can reveal about income inequality for the world as a whole [...] In short sociologist are interested in whether there is intercountry convergence in the case where individuals, not nations, are given equal weight. Thus sociologists are more interested in the population-weighted studies. »

C

HAPITRE

IX : Q

UELQUES TYPOLOGIES EN COMPARAISON INTERNATIONALE

,

LEURS APPORTS ET LEURS LIMITES

En comparaison internationale, quand on veut expliquer les différences d'ampleur d'inégalité selon les pays, il est nécessaire d’identifier les caractéristiques nationales susceptibles d'influencer le niveau des inégalités. Pour ce faire, différents types de facteurs (culturels, institutionnels, éducatifs, démographiques...) peuvent être mobilisés. Ne pouvant chercher dans toutes les directions, je vais ici me concentrer sur les facteurs institutionnels – l'Europe offrant une diversité intéressante à cet égard et cette approche me semblant pertinente quand on s'intéresse à des questions d'ordre socio-économique. Toutefois, même au sein de cette perspective plus restreinte, les facteurs potentiels sont très nombreux. C'est pourquoi il peut être utile, pour baliser dans un premier temps la recherche, de recourir à des typologies. Ces dernières sont des classifications de pays en modèles selon les facteurs qui intéressent le chercheur. Elles sont souvent utilisées en comparaisons internationales, même si elles présentent certains inconvénients.

L'objectif de ce chapitre est donc de présenter les typologies les plus connues et les plus appropriées à mon objet de recherche : les modèles d'État-providence96, les typologies des relations

Dans le document À Dominique et Antoine 1 (Page 97-103)