• Aucun résultat trouvé

Description des populations

Dans le document Genre et données longitudinales (Page 192-196)

La qualification des emplois dans les trajectoires d’insertion des jeunes de niveau V

1. Description des populations

Les enquêtes de génération du Céreq sont des enquêtes rétrospectives sur le devenir des jeunes après leur sortie du système éducatif.

L’enquête Génération 92 a été réalisée en 1997-1998 auprès de 27 000 jeunes sortis de formation initiale en 1992, à tous les niveaux de diplômes et de spécialités. L’objectif de cette enquête est d’analyser les cinq premières années de vie active au regard notamment du parcours scolaire et des diplômes obtenus. Différents thèmes ont été traités lors de ces interrogations : la formation, l’itinéraire professionnel, l’emploi, le contexte familial et social. Cette enquête a une large représentativité, elle couvre 530 000 sortants sur les 640 000 estimés par l’enquête Emploi.

L’enquête Génération 98 a été réalisée au printemps 2001 auprès de 54 000 jeunes sortis de formation initiale en 1998, à tous les niveaux de diplômes et de spécialités. Les jeunes sont interrogés sur leurs trois premières années de vie active (depuis leur sortie en 1998 jusqu’en mars 2001) et seront réinterrogés entre 2003 et 2005. La construction de l’échantillon permet une bonne représentation nationale par filières fines de formation et une représentation régionale par grands niveaux. Plus de 98 % des formations initiales dispensées en France métropolitaine sont couvertes, contre 82 % des formations dans Génération 92. Cette enquête vise à rendre compte des différentes com-posantes du parcours d’insertion professionnelle, et explore toutes les situations (emploi, chômage, formation…).

L’accent n’est plus uniquement mis sur les périodes d’emploi, comme dans Génération 92, mais également sur les périodes de chômage ou de formation, notamment.

La Génération 92 se distingue des précédentes pour deux raisons. D’une part, les effectifs de sortants, en baisse depuis 1986, sont à nouveau en hausse. Ensuite, pour la première fois, les sortants de niveau baccalauréat deviennent plus nombreux que ceux de niveau cap-bep. De 1992 à 1994 les indicateurs conjoncturels ne sont pas très bons : taux de chômage des jeunes à la hausse, volume global des recrutements à la baisse, accroissement de la part des emplois temporaires parmi les recrutements. Ce contexte, associé à la croissance des effectifs de sortants, n’est donc pas très favorable en début de parcours.

Les jeunes de la génération 98 sont plus nombreux qu’en 1992, 742 000, et leur niveau de qualification est globalement de plus en plus élevé. La génération 98 bénéficie d’une amélioration substantielle du marché du travail dans les années 1998-2001. Le recul du chômage, perceptible dès 1997, s’est accéléré à partir de janvier 1999. En mars 2001, il était au plus bas depuis 1992. La reprise de l’emploi s’est également intensifiée, les emplois du secteur tertiaire ayant fortement augmenté et la hausse des emplois à temps complet ayant été plus importante que celle des emplois à temps partiel. L’intérim s’est également fortement développé.

L’objectif de notre étude étant de mesurer l’effet d’une formation par apprentissage dans le processus d’insertion, nous ne considérons ici que les formations pouvant être préparées soit dans un lycée professionnel soit par apprentissage et préparant à un diplôme de niveau V. En outre, pour permettre une comparaison des deux générations de sortants, nous utilisons ici une version tronquée (à trois ans) de l’enquête « Génération 92 ».

Pour la génération 92, nous considérons une population de 5 025 hommes dont 42,39 % d’apprentis et une population de 3 513 femmes dont 28,92 % d’apprenties. Pour la génération 98, nous considérons une population de 8 017 hommes dont 55,92 % d’apprentis et une population de 4 598 femmes dont 25,58 % d’apprenties.

Le pourcentage d’apprentis dans nos échantillons est relativement stable chez les femmes (moins de 30 %) alors qu’il est en augmentation chez les hommes (56 % pour les sortants de 1998 contre 42 % chez les sortants de 1992).

La réussite au diplôme est en augmentation entre les deux générations et elle est relativement comparable entre les apprentis et les lycéens (74 %, en moyenne, pour les sortants de 1998 contre 67 % pour les sortants de 1992), même si ces derniers réussissent mieux, en particulier les femmes.

2. Le modèle

Nous supposons que chaque individu i de la population est soumis à un processus de participation3 Yti décrivant sa situation sur le marché du travail au temps t (t ≥ 0). Le problème général à analyser et la configuration particulière des enquêtes du Céreq Génération 92 et Génération 98 nous conduisent à supposer que le processus Yti prend ses valeurs à un instant t dans l’ensemble E =

{

jΝ,1 j5

}

, où l’indice j enregistre les cinq états suivants :

1. Chômage (C)

2. Emploi non qualifié (ENQ) 3. Emploi qualifié (EQ)

4. Emploi hautement qualifié (EHQ) 5. Inactivité

Contrairement à la plupart des études, les différents états d’emploi occupés sur le marché du travail ne sont pas liés au type de contrat signé (contrat à durée indéterminée, à durée déterminée ou emploi aidé, voir par exemple Bonnal, Fougère et Sérandon (1994, 1997)) mais à la qualification occupée au sein de l’emploi.

Considérons les notations du modèle. L’indice l est utilisé pour indiquer le rang d’un épisode de chômage, d’emploi… au cours de la trajectoire individuelle sur le marché du travail. Étant donné que l’on n’observe que des jeunes entrant sur le marché du travail4 cet indice ne peut prendre que des valeurs entières positives : l =0 caractérise le premier état occupé immédiatement après la sortie du système éducatif (c’est-à-dire la situation initiale du jeune sur le marché du travail), l =1 indice l’épisode suivant ce premier état et ainsi de suite. La valeur maximale prise par l pour chaque observation (notée

L

i) indique le nombre de transitions effectuées par le jeune au cours de la période d’observation (qui est ici exactement égale au temps passé sur le marché du travail). Les trajectoires sont toutes censurées à droite au mois d’avril5 97 (resp. 2001). Cette date sera notée

T

. Pour un jeune i,

i

τ

l, indique la date aléatoire d’entrée dans le lième épisode de la trajectoire de participation. Par conséquent,

i

Y

l

τ , est l’état occupé par l’individu i durant le lième épisode de sa trajectoire et

u

l,i

= τ

l+1,i

− τ

l,i est une variable aléatoire positive représentant la durée de séjour dans ce lième épisode.

Pour simplifier la modélisation, nous supposons que les transitions individuelles sur le marché du travail ne dépendent pas des effets saisonniers. De plus, étant donné que les jeunes entrent tous à la même date sur le marché du travail (septembre 1992 ou 1998 selon l’enquête), cette date peut être considérée comme l’origine de l’axe individuel des temps

τ

0,i

= 0

. Par conséquent,

τ

l,i mesure le temps écoulé entre la date d’entrée sur le marché du travail et la date à laquelle l’individu i effectue la lième transition sur le marché du travail.

Nous supposons que les transitions individuelles sur le marché du travail sont représentées par des modèles avec intensités multiplicatives mélangées6. Dans cette classe de modèles statistiques, les fonctions d’intensité (de hasard) dépendent des composantes individuelles aléatoires spécifiques aux différents types de transition qui sont en général

3. Pour une présentation générale du traitement économétrique des données de transition, voir par exemple Lancaster (1990) ou Florens, Fougère, Kamionka et Mouchart (1994).

4. Le début de la trajectoire professionnelle est d’une part connue et d’autre part identique pour toute la population étudiée (septembre 92 ou septembre 98 selon l’enquête). Ces informations nous permettent d’éviter les habituels problèmes de condition initiale et de biais d’échantillonnage.

5. Avril est le mois de fin d’observation pour la plupart des jeunes des deux enquêtes.

6. Mixed Proportional Hazard (MPH), voir par exemple Ridder (1990) ou Lindeboom et Van den Berg (1994) pour une présentation de ces modèles.

constants au cours du temps. Pour un individu i il y a donc, a priori, autant de composantes aléatoires qu’il y a de transitions possibles, ces composantes pouvant être dépendantes entre elles.

Nous supposons que, pour un individu i7, l’intensité de transition vers l’état k après une durée de séjour égale à ul

dans l’état j8 durant le lième épisode de son processus de transition sur le marché du travail, est définie par

jk (k),

X (.)

est un vecteur de variables individuelles dépendantes de l’épisode l . La valeur prise par ces variables est fixée à la date d’entrée dans le lième épisode. Elle reste donc constante tout au long de cet épisode. Ce vecteur contient par exemple des variables telles que le niveau de formation, mais aussi des covariables décrivant la trajectoire antérieure sur le marché du travail telle que par exemple le dernier état occupé. La valeur prise par ces variables est supposée agir sur une éventuelle transition de l’état j vers l’état k par l’intermédiaire d’un vecteur de paramètres inconnus

β

jk (à estimer),

υ

jk est une variable aléatoire positive de fonction de répartition

F

jk dont la spécification peut dépendre des états j et k. Cette variable capture l’effet de l’hétérogénéité individuelle non observée sur la transition de l’état j vers l’état k.

Étant donné le nombre de transitions possibles9 nous restreignons la taille du vecteur aléatoire multivarié

υ

jk en supposant que

υ

jk

= υ

k

∀ j ∈ E

.

Cela signifie que le terme d’hétérogénéité affectant la transition de l’état j vers l’état k est spécifique à l’état de destination k. Cette dernière hypothèse implique que, quel que soit l’état occupé, une valeur relativement élevée de

υ

j est associée à une probabilité relativement forte de se trouver dans l’état j. Par exemple, un individu ayant un

υ

5 relativement élevé montre un faible attachement au marché du travail de cet individu qui va probablement se diriger vers l’inactivité.

Enfin, comme le suggèrent Flinn et Heckman (1982b) nous supposons que les composantes

υ

k

(

k =1,...,5

)

sont générées par une variable aléatoire normalement distribuée10

ω

et telles que :

υ

k

= exp( α

k

ω

i

)

ω

~ IN(0,1) . Les intensités de base sont supposées être constantes par morceaux :

⎪ ⎪

7. À partir de maintenant, l’indice i va être volontairement omis des formules pour une meilleure lisibilité de celles-ci.

8. Dans cette modélisation, l’état j peut être égal à l’état k pour toutes les situations d’emploi.

9. Il y a quatre transitions possibles à partir des états de chômage et d’inactivité et cinq à partir des trois états d’emploi, cela donne donc par conséquent un vecteur de 26 composantes aléatoires.

10. Cette spécification permet aux variables explicatives non observées d’être mutuellement dépendantes. Toutefois la corrélation entre les υk est très restrictive. Pour obtenir une plus grande flexibilité dans les corrélations il faudrait supposer que les composantes υk suivent une distribution discrète multivariée avec un nombre fini de points de support (voir Lindeboom &

Van den Berg (1994) ou Van den Berg, Lindeboom & Ridder (1994) pour plus de détails). On peut toutefois noter que Bonnal, Fougère & Sérandon (1997) estiment un modèle similaire à celui présenté dans ce travail en considérant les deux types de distributions. Les résultats obtenus suite à ces estimations semblent relativement proches. Une façon plus complète d’introduire l’hétérogénéité non observable est donnée par Gilbert, Kamionka et Lacroix (2001).

Avec pour :

(2a) j=1 et k=2,3,4 ou j=2,3,4 et k=1,2,3 ;

(2b) j=5 et k=1,2,3,4 ou j=2,3,4 et k=4,5 ou j=1 et k=5.

Écrivons maintenant les fonctions de densité. Supposons que le processus entre dans l’état j à l’instant

τ

l

( 0 ≤ lL )

. Examinons la distribution en probabilité de la durée de séjour dans l’état j, état visité à la

lième transition du processus. La densité conditionnelle de la durée de séjour observée dans l’état j, durant le lième épisode du processus, étant donné que celui-ci commence à l’instant

τ

l et finit à l’instant

τ

l+ ul par une transition

La densité conditionnelle définie en (3) est la contribution à la vraisemblance du lième épisode lorsque celui-ci n’est pas censuré à droite, c’est-à-dire lorsque

τ

l+1

= τ

l

+ u

l

T

. Lorsque le lième épisode dure plus de

T − τ

l, la contribution à la vraisemblance de cet épisode censuré à droite est :

)

où Sj(.|.) est la fonction de survie conditionnelle de la durée de séjour dans l’état j.

Dans notre échantillon, tous les jeunes entrent sur le marché du travail à la même date. En revanche, chacun d’eux ne se trouve pas forcément dans le même état. La prise en compte de la transition du système éducatif au marché du travail peut être résumée par les probabilités suivantes :

5

Où X(τ0) est un vecteur de variables individuelles observées à la date d’entrée sur le marché du travail.

β0j, (j=1,…,5) est un vecteur de paramètres à estimer associé à X(τ0). Les cinq vecteurs de paramètres n’étant pas simultanément identifiables12, nous avons fixé le vecteur β01 à 0.

11. Voir Fougère et Kamionka (1996) pour une démonstration.

12. Comme pour l’ensemble des modèles logit.

La contribution à la vraisemblance d’un individu (en omettant l’indice i) avec des covariables X(τ0) à l’entrée sur le 1 lorsque le jeune (i) transite du système éducatif vers l’état j et 0 sinon.

Une procédure standard de maximisation de la vraisemblance permet d’obtenir des estimations convergentes de α=( αk)k=1,…,5, β =( βjk, β0k) et des paramètres des intensités de base h0jk .

Dans le document Genre et données longitudinales (Page 192-196)

Documents relatifs