• Aucun résultat trouvé

La préparation des données : harmoniser les statistiques d’hier et d’aujourd’hui

Chapitre 1 Mobilités résidentielles et socioprofessionnelles : un traitement par l’enquête emploi

2. La préparation des données : harmoniser les statistiques d’hier et d’aujourd’hui

L’enquête Emploi qui remonte loin dans le temps, a vu son dispositif s’étoffer au fil des années, et s’est adaptée aux nouveaux problèmes économiques et sociaux qui ont progressivement émergé. Il s’agit là de véritables qualités qui contribuent à l’installer solidement dans le paysage statistique français, tout en rendant son utilisation délicate. On explicitera ici le travail de préparation que nous avons mené pour pouvoir le faire. On décrira les grandes variables qu’on a créées pour être utilisées en séries longues puis deux types de problèmes qu’il a fallu résoudre, avant de décrire la façon dont on mesurera par la suite les mobilités résidentielles et socio-professionnelles des individus.

106 C’est le cas de toutes les variables connaissant d’importants changements de nomenclature (comme la

catégorie socioprofessionnelle) mais aussi d’autres variables comme celle servant à identifier l’ancienneté des individus dans leur emploi. Le traitement de ces ruptures est détaillé dans la suite de ce chapitre.

2.1. L’établissement de séries longues

En reprenant les enquêtes Emploi depuis 1968, on a pu créer seize grandes variables stables dans le temps. Elles prennent les mêmes modalités à chaque vague d’enquête et ont été créées de manière à éviter les ruptures de série. Autant que possible, on a cherché à créer des variables pouvant être présentes à la fois dans les blocs (n) et dans les blocs (n-1). Ces variables couvrent trois domaines : les caractéristiques personnelles des individus, leur situation socio-professionnelle, et leur situation familiale et résidentielle. La présentation détaillée des variables utilisées pour construire ces séries longues est en annexe (annexe 2).

On a d’abord construit cinq variables décrivant les caractéristiques personnelles des individus dans l’enquête, qui sont présentées dans le tableau suivant :

Tableau 2. Identification des caractéristiques personnelles des individus

Variable Modalités détaillées Présence de la variable

Remarques

Sexe 1. Homme 2. Femme 1968-2011 (n et n-1) Âge Variable continue 1968-2011 (n et n-1)

Diplôme le plus élevé

obtenu

1. Aucun diplôme

2. Certificat d’études primaires 3. BEPC

4. CAP, BEP 5. Bac et Bac+1 6. Bac+2

7. Bac + 3 et plus

8. Grandes écoles, doctorat

1968-2011 (n)

Entre 15 et 20% de non- réponses à cette question jusqu’en 1989107 Personne de référence du ménage 1. Oui 2. Non 1968-2011

Passage de la notion de « chef de famille » à celle de « personne de référence du ménage » en 1990 Salaire mensuel net Variables continue Regroupé en déciles 1990-2002 (n)

Le salaire mensuel net est disponible entre 1982 et 1989, mais déjà regroupé en tranches fixes

Note : On présente ici le niveau le plus détaillé des modalités des variables construites. Elles pourront être regroupées au fil des analyses

L’une des difficultés soulevées par le fait de travailler sur une période de quarante ans est que certaines modalités ont changé de sens ou de valeur au fil du temps. On pense ici en premier lieu au diplôme : être bachelier n’avait pas la même valeur symbolique, culturelle

107 Des individus non-diplômés, qui généralement occupaient une position professionnelle plutôt élevée,

refusaient de le déclarer lors de l’enquête. Ce problème a été pris en compte et résolu à partir de 1990. Il faut cependant réserver une catégorie « non déclaré » avant 1990. La non-prise en compte de la population qui refuse de déclarer son niveau de diplôme, au profil atypique, perturbe grandement les résultats obtenus.

62

et professionnelle en 1968 qu’aujourd’hui. L’âge lui-même n’a pas le même sens : un individu de 59 ans en 1970 avait pratiquement atteint l’âge de la retraite alors que plusieurs années d’activité l’attendent probablement encore en 2011. Les catégories utilisées par l’INSEE peuvent aussi évoluer, comme le fait (très lentement) celle de « personne de référence du ménage » qui a remplacé les plus anciennes notions de « chef de ménage » et de « chef de famille ». Par construction, et il s’agit là d’une règle explicite, le chef de ménage ou de famille ne pouvait pas être une femme si un homme appartenait au ménage. Cette définition a contribué à faire du genre masculin le genre « neutre » de référence et a été lentement révisée (Saint Pol, Deney et Monso 2004 ; Amossé et De Peretti 2011). Cela dit, le passage à la notion de « personne de référence du ménage » en 1990 n’a pas changé la prépondérance des hommes à la tête des ménages : entre 2003 et 2011, plus de 70% des « personnes de référence » sont des hommes, et 99,5% des « conjoints de la personne de référence » sont des femmes. Notons par ailleurs que les couples homosexuels sont très mal pris en compte dans l’enquête Emploi. Les grandes variables socio-démographiques, aussi stables dans le temps qu’elles puissent paraître, doivent donc elles aussi être maniées avec précaution en longue période.

L’enquête Emploi est très efficace pour identifier la situation socio-professionnelle des individus en longue période :

Tableau 3. Identification de la situation socio-professionnelle des individus

Variable Modalités détaillées Présence de la variable Remarques

Statut d’activité 1. Actifs occupés 2. Chômeurs 3. Etudiants 4. Autres inactifs 1968-2011 (n et n-1)

Cette variable engage des arbitrages

méthodologiques particuliers. Voir infra

Catégorie socio-professionnelle

1. Agriculteurs exploitants 2. Artisans, commerçants, chefs d’entreprise 3. Cadres et professions intellectuelles supérieures 4. Professions intermédiaires 5. Employés 6. Ouvriers 1968-2011 (n et n-1) Le changement de nomenclature en 1982 crée une rupture de série Le recodage des professions a été incomplet en 1982 Catégorie socioprofessionnelle détaillée 1. Agriculteurs exploitants

2. Artisans, commerçants, chefs d’entreprise 3. Cadres et professions intellectuelles supérieures 4. Professions Intermédiaires … 1982-2011 (n et n-1)

Pour la distinction entre ouvriers et employés qualifiés et non-qualifiés, voir infra

5. Employés qualifiés 6. Employés non qualifiés 7. Ouvriers qualifiés 8. Ouvriers non qualifiés Nature de l’employeur 1. Indépendant 2. Secteur public 3. Secteur privé 1968-2011 (n et n-1) Secteur d’activité 1. Agriculture 2. Industrie 3. Construction 4. Services 1968-2011 (n et n-1) La nomenclature des activités beaucoup changé (voir infra). La manipulation de cette variable en longue période est délicate

Type de contrat

1. Titulaire de la fonction publique

2. CDI du secteur public

3. Autres contrats du secteur public

4. CDI du secteur privé

5. Autres contrats du secteur privé

1982-2011 (n et n-1)

Ancienneté dans

l’emploi 1. Inférieure à un an 2. Supérieure à un an 1975-2011 (n)

De nombreuses non- réponses en 2003 ont rendu nécessaire de procéder à un redressement. Voir infra

Non seulement l’enquête Emploi propose de nombreuses façons d’identifier les caractéristiques socio-professionnelles des individus, mais toutes ces informations sont disponibles en (n) et en (n-1). Cependant, les changements de nomenclature rendent parfois difficile de créer des variables homogènes en longue période. C’est notamment le cas pour le secteur d’activité, identifié à partir de l’activité économique de l’établissement employeur, dont la nomenclature est passée de la NAE à la NAP en 1973 puis à la NAF en 1993, elle-même révisée deux fois en 2003 et 2008. Concernant les catégories socio- professionnelles, le changement de nomenclature en 1982 crée une forte rupture de série qu’on a pu nettement atténuer en procédant à la réaffectation de quelques professions avant 1982. Ainsi, on a choisi de classer les contremaîtres avec les professions intermédiaires, les ouvriers agricoles avec les ouvriers, et les artistes avec les cadres et professions intellectuelles supérieures. Ce choix peut être discuté ; il contribue en particulier à priver la catégorie « ouvriers » de sa frange supérieure avant 1982. On a cependant choisi ici de privilégier la cohérence des variables en longue période.

Un des défauts de la nomenclature des catégories socio-professionnelles, qu’il s’agisse des CSP avant 1982 ou des PCS depuis, est qu’elle identifie directement les ouvriers qualifiés, mais pas les employés qualifiés. Burnod et Chenu (2001) avaient pourtant montré, en

64

travaillant notamment sur leurs conditions de travail, que cette distinction a au moins autant de sens que la distinction faite entre ouvriers qualifiés et non qualifiés. Amossé et Chardon (2006) ont eux aussi montré la pertinence qu’il y a à adopter une grille de lecture séparant employés et ouvriers qualifiés d’une part et non qualifiés d’autre part. On privilégiera la méthode d’identification des employés qualifiés qu’ils proposent en partant des professions détaillées à quatre chiffres. Cela dit, il est possible de détailler la catégorie socio- professionnelle des individus en utilisant le deuxième niveau de la nomenclature des PCS, qui identifie 31 professions. Dans un souci de cohérence, on utilisera la distinction entre employés qualifiés et qualifiés proposée par Peugny (2006) quand on travaillera sur les PCS de niveau 2.

Tableau 4. Identification de la situation familiale et résidentielle des individus

Variable Modalités détaillées Présence de la variable Remarques Département

de résidence Numéro de département 1969-2011 (n et n-1) Statut d’occupation du logement 1. Propriétaire 2. Locataire 3. Autres 1968-2011 (n)

A partir de 1990, il est possible de distinguer les locataires du parc HLM et les locataires du parc privé Composition familiale du ménage 1. Individu seul 2. Famille monoparentale 3. Couple sans enfants 4. Couple avec enfants 5. Ménage complexe

1982-2011 (n)

Profil

d’activité du ménage

1. Individu seul, actif 2. Individu seul, inactif

3. Famille monoparentale, adulte actif

4. Famille monoparentale, adulte inactif

5. Couple, deux actifs 6. Couple, un actif 7. Couple, aucun actif 8. Ménage complexe

1982-2011 (n)

Avant 2003, il n’y a pas assez d’informations pour savoir si le conjoint de l’enquêté du ménage est actif occupé ou chômeur

C’est dans ce domaine que l’enquête Emploi rencontre sa plus grande limite. Les informations sur la composition du ménage et la situation résidentielle ne sont pas collectées dans le bloc (n-1). Il est donc impossible d’identifier les changements de situation des individus d’une année sur l’autre, et donc de tester la plus ou moins grande coïncidence de ces changements de situation et des mobilités résidentielles ou socio- professionnelles. Plus encore, il n’est pas réellement possible de travailler sur la composition du ménage ou le statut d’occupation du logement des mobiles. Car un individu mobile a pu voir sa situation résidentielle changer à l’occasion de sa mobilité, voire aussi la

composition de son ménage (dans un cas de multilocalité résidentielle par exemple). La composition du ménage et le statut d’occupation du logement peuvent être le produit de la mobilité, il est donc très délicat d’utiliser leur valeur en (n) pour rendre compte d’une mobilité ayant eu lieu entre (n-1) et (n).

Enfin, et c’est peut-être le point le plus regrettable dans notre perspective, l’enquête Emploi ne permet pas d’identifier les territoires dans lesquels résident les individus. Sont connus le département de résidence de l’individu à l’enquête et un an avant l’enquête, ainsi que quelques informations dispersées entre les vagues d’enquête (comme le fait de réider dans un canton rural ou non, ou taille de l’unité urbaine de résidence), lesquelles informations ne sont pas disponibles dans le bloc (n-1). Ce manque d’informations est frustrant ; il faut cependant garder à l’esprit que le taux de sondage de l’enquête Emploi ne permettrait pas de descendre à des niveaux territoriaux plus fins que l’échelle départementale ou de travailler sur d’autres agglomérations que les plus grandes de France. Qui plus est, la méthode de sondage aréolaire de l’enquête Emploi est propice aux effets de grappe et donc peu adaptée à la prise en compte de logiques territoriales.

2.2. Deux problèmes posés par l’enquête Emploi

La construction de variables de longue période peut poser d’importants problèmes de méthode, notamment lors des changements d’enquête ou de nomenclature. Mis à part l’âge et le sexe des individus, chaque variable de longue période présentée ci-dessus a posé des problèmes de construction. On a identifié deux problèmes principaux qu’on illustrera chacun par un exemple avant d’exposer les solutions que l’on a choisi de retenir : les changements de définition et de méthode, et les changements de champ d’une variable.

a. Intégrer les changements de définition et de méthode

La définition du statut d’activité (actif occupé, chômeur ou inactif) est toujours problématique. Les déclarations des individus ne correspondent pas aux catégories élaborées par les économistes et les statisticiens. Il est en particulier vite apparu que de nombreux individus pouvaient se déclarer chômeurs tout en étant actifs occupés au titre de critères objectifs : c’est le « halo » du chômage108. Parce qu’elle permet à la fois une mesure déclarative et une mesure objectivée du chômage, l’enquête Emploi sert de source

66

première pour identifier ce halo. Elle y est d’autant plus adaptée qu’elle remonte loin dans le temps et qu’elle reflète les évolutions qu’ont connues les définitions du chômage. Identifier le statut d’activité des individus pose donc un double problème de cohérence : au fil du temps d’une part, et entre définitions différentes de l’emploi et du chômage d’autre part.

Ces définitions ont plusieurs fois changé afin de répondre aux normes élaborées au niveau international et européen. Afin de rendre possible les comparaisons internationales, ces normes sont contraignantes et l’enquête Emploi y a progressivement été adaptée. Dès 1975, elle inclut des questions permettant de rapprocher la définition du chômage de la définition établie par le Bureau International du Travail. Depuis 1982, une variable permet d’identifier directement les chômeurs au sens du BIT. Est comptabilisé comme chômeur au sens du BIT toute personne n’ayant pas travaillé au cours de la semaine de référence, étant disponible pour travailler dans les deux semaines, ayant cherché activement du travail ou ayant trouvé un emploi qui commence dans les trois mois. En 2007, les critères d’identification des chômeurs ont été modifiés et mis en cohérence avec l’interprétation qu’en fait Eurostat : la simple inscription à Pôle emploi ne suffit plus à définir la recherche active d’un emploi109. Cette modification a été appliquée rétrospectivement à partir de l’enquête 2003.

L’identification du statut d’activité en longue période est donc soumise au risque d’importantes ruptures de série liées à ces changements de définition de l’activité et du chômage. Mais, et cela est plus important encore dans notre perspective, l’identification du statut d’activité n’est pas homogène en (n) et en (n-1). En effet, le statut d’activité au sens du BIT n’est pas fourni pour la situation des enquêtés en (n-1) et le bloc (n-1) n’est pas assez détaillé pour l’identifier. Identifier le statut d’activité en (n) grâce aux variables « objectives » risque donc de créer un décalage avec le statut d’activité en (n-1), les seules variables qui permettent d’identifier le statut d’occupation en (n-1) étant des variables déclaratives. Or, on sait que les questions déclaratives donnent un nombre de chômeurs plus élevé que les variables « objectives » construites à partir de plusieurs informations séparées. Ces variables « objectives » n’existant pas dans les blocs (n-1), il est impossible d’identifier de manière objective le statut d’activité des individus à la fois en (n) et en (n-1). Afin de construire des variables d’activité les plus homogènes possibles, on a donc choisi ici

109 Voir http://travail-emploi.gouv.fr/etudes-recherches-statistiques-de,76/statistiques,78/chomage,79/les-

d’utiliser les variables déclaratives disponibles. Mais la place de ces variables déclaratives elles-mêmes a changé dans l’enquête.

De 1968 à 2002, une des premières questions posées aux enquêtés est le « filtre d’occupation ». Ce « filtre » est une variable déclarative à l’occasion de laquelle l’enquêté se classe lui-même. Il peut aussi être l’objet de ruptures de série d’une vague d’enquête à l’autre, la formulation des questions « filtres » ayant changé au fil du temps, et la stratégie de l’INSEE quant au respect des simples déclarations des enquêtés a évolué. En effet, entre 1968 et 1981 les instructions aux enquêteurs insistent sur la nécessité de respecter scrupuleusement la déclaration de l’enquêté. Il avait été constaté que le statut d’activité déclaré par les individus n’était pas homogène entre le recensement (qui se fait sans intervention d’un enquêteur) et l’enquête Emploi. Les Instructions aux enquêteurs 1970 stipulent donc que :

« L’enquêteur doit se contenter de présenter la carte questionnaire n°2 et d’enregistrer la réponse qui aura été donnée spontanément. Il est interdit de corriger par la suite. Cette question doit, en effet, rester très analogue à celle du recensement » (INSEE 1970, p. 62).

Les Instructions 1975 s’adressent dans les mêmes termes aux enquêteurs :

« Vous devez vous abstenir de tout commentaire et de toute précision. La personne interrogée doit elle-même indiquer quelle catégorie convient le mieux » (INSEE 1975, p. 51).

Cette instruction est justifiée ainsi :

« La réponse à la question FILTRE est fondamentale ; et il est prouvé qu’elle est extrêmement sensible à la forme de la question […]. On a remarqué que la même question posée au recensement sans l’intervention d’un enquêteur et à l’enquête- emploi donnait un résultat très différent dans l’un et l’autre cas. Il faut donc pour que le résultat obtenu soit homogène d’un enquêteur à l’autre et avec le recensement, que l’enquêteur soit aussi neutre que possible » (INSEE 1975, p. 51)

68

Entre 1982 et 2002, la règle change et l’INSEE introduit une intervention de l’enquêteur. Les enquêtés ne sont plus invités à se classer spontanément d’après un carton présentant les différentes catégories et des instructions sont données aux enquêteurs pour classer eux- mêmes certains cas. Par exemple, les apprentis sous contrats et les stagiaires rémunérés doivent être considérés comme actifs occupés, alors que les invalides et les travailleurs en congé non rémunéré ne doivent plus l’être110. Ce changement est motivé par les difficultés qu’éprouvent les enquêteurs à s’effacer en début d’enquête ainsi que par les décalages qui perdurent avec les résultats du recensement (Affichard 1987, p. 104).

Les filtres d’occupation sont bien adaptés à l’étude des mobilités. Le filtre en (n-1) est en effet explicitement construit de la même manière que le filtre en (n). Utiliser ces filtres permet donc de minimiser le risque d’erreur au moment d’identifier les changements individuels de statut d’activité. On peut noter des taux de non-réponse élevés au filtre (n-1), mais ils ne concernent que les années 2001 (17,9%) et 2002 (17,8%). Mais ce choix d’utiliser les statuts d’activité déclaratifs n’est plus possible pour l’année (n) à partir de 2003. Afin de permettre une meilleure mesure du chômage au sens du BIT, le filtre d’occupation est retiré du début de l’enquête :

« Jusqu’à [2002], en effet, la première question de l’enquête emploi annuelle consistait en une auto-classification. Le règlement européen [n°1987.2000 sur la définition européenne du chômage] interdit qu’une telle question précède les questions factuelles permettant la mesure de l’activité au sens du BIT » (Goux 2003, p. 51).

Les enquêtés sont certes toujours invités à déclarer leur « situation principale » au début du module « Calendrier rétrospectif d’activité »111. Mais Goux (2003, p. 51) indique que, placée plus loin dans le questionnaire, cette question « perd de sa spontanéité » et ne peut plus être utilisée. De plus, le module « Calendrier rétrospectif d’activité » ne concerne que les individus en première interrogation, et l’utiliser reviendrait à renoncer à 5/6e de l’échantillon.

À partir de 2003, il n’est donc plus possible d’identifier les chômeurs dits « au sens de l’enquête », c’est-à-dire les individus se déclarant comme chômeurs. Pour connaître le statut d’activité des enquêtés en (n), il faut donc choisir entre les deux approches du statut

110 Instructions aux enquêteurs 1982, page 63, reprises par Instructions aux enquêteurs 1990, page 31 111 Question K1 : « Quelle est ce mois-ci votre situation principale ? », variable SP00.

d’activité au sens du BIT, celle qui prévalait avant l’ajustement de 2007 (ACTANC – « Activité au sens du BIT selon l’ancienne interprétation ») et celle qui prévaut depuis (ACTEU – « Activité au sens du BIT selon l’interprétation communautaire »). Il y a effectivement un décalage entre les deux. Chaque année de 2003 à 2011, on compte entre 1 000 et 1 500 individus classés « inactifs » selon ACTANC et « actifs occupés » selon ACTEU112, et entre 1 500 et 2 000 individus classés « chômeurs » selon ACTANC et « inactifs » selon ACTEU113. Pour choisir entre ces deux variables, on a là encore choisi de privilégier la cohérence entre la mesure de l’activité en (n) et en (n-1), c’est-à-dire de faire en sorte que la mesure du statut d’activité des individus en (n) à une date donnée soit la plus proche possible de la mesure de leur statut d’activité en (n-1) à l’enquête suivante. Comme le statut d’occupation en (n-1) est donné par une question déclarative (EOCCUA – « Occupation un an auparavant »), on a choisi la variable en (n) qui présente le moins d’écarts avec celle-ci. Pour ce faire, on a mesuré pour chaque année la part d’actifs occupés et de chômeurs d’après EOCCUA, ACTANC et ACTEU :