Impact d'une réduction d'une année d'étude sur les salaires : résultats empiriques à partir de l'introduction des Cégeps

(1)

Impact d’une réduction d’une année d’étude sur les salaires:

résultats empiriques à partir de l’introduction des Cégeps

Mémoire Franck-Hermann Dogoua Maîtrise en économique Maître ès sciences (M.Sc.) Québec, Canada © Franck-Hermann Dogoua, 2017

(2)

Impact d’une réduction d’une année d’étude sur les salaires:

résultats empiriques à partir de l’introduction des Cégeps

Mémoire

Franck-Hermann Dogoua

Sous la direction de:

Bernard Fortin, directeur de recherche Marion Goussé , codirectrice de recherche

(3)

Résumé

Ce mémoire cherche à évaluer l’impact d’une réduction d’une année de scolarité sur les salaires. Plusieurs travaux de recherche ont montré l’importance des formations universitaires sur l’employa-bilité et les salaires. Des scientifiques ont également investigué sur la question des écarts salariaux. La plupart d’entre eux s’appuient sur des théories économiques, et tentent de répondre à cette pro-blématique par les différents niveaux de formation scolaire au sein d’un groupe d’individus, ou encore par le nombre d’années d’expérience sur le marché du travail. Leurs résultats distincts mettent en évidence la difficulté à expliquer intégralement les différences de salaires. Dans ce mémoire, nous nous appuyons sur la réforme du système éducatif québécois survenu en 1967, pour évaluer l’impact d’une réduction d’une année de scolarité sur les salaires. Suite à l’actualité socio-éducative qui prévalait à cette époque, le gouvernement Lesage a été amené à prendre en considération le rapport fourni par la commission Parent sur la réforme du système éducatif. Nous nous intéressons donc de façon particulière au passage du cours classique au Cégep. À la base, le cours classique était de huit ans et sanctionné par un baccalauréat ès arts. Avec la création du Cégep, le nombre total d’années d’étude avant l’université a été réduit à sept. Ceci a occasionné en 1968 l’entrée simultanée de deux cohortes d’étudiants en première année d’université. Pour réaliser cette étude, nous utilisons les données de la division des opérations de Statistique Canada, sur le Recensement de la population de 1981. À partir d’une approche de Regression Discontinuity design, nous confirmons qu’une année de scolarité en moins affecte négativement les salaires, de façon significative. Cet effet est de 18% dans notre meilleure spécification.

(4)

Abstract

This report aims to evaluate the impact of a reduction of one year of schooling on future wages. Several research studies have shown the importance of university training on employability and wages. Scientists have also investigated the issue of wage differentials. Most of them rely on economic theories, and try to explain this issue by the different levels of education by differences in educational attainment within a group of individuals, or by the number of years of experience in labor market. Their distinct results highlight the difficulty in explaining wage differences as a whole. In this master’s thesis, we rely on the reform of Quebec’s education system in 1967, to evaluate the impact of an extra year of schooling on remuneration. Following the current socio-educational situation prevailing at that time, the Lesage government was led to take into consideration the report provided by the Parent commission on the valuation of the education system. We are particularly interested in the graduation from classical courses to CEGEP. Initially, the classical course was eight years old and culminated in a Bachelor of Arts degree. The creation of the CEGEP reduced the number of years of study before university to seven. This led in 1968 to the simultaneous entry of two cohorts of students in the first year of university. This study uses data from the Statistics Canada operations division on the 1981 Census of Population. Based on a Regression Discontinuity design approach, we have confirmed that one less year of schooling negatively affects Wages, significantly. This effect is 18% in our best specification.

(5)

Table des matières

Résumé iii

Abstract iv

Table des matières v

Liste des tableaux vi

Liste des graphiques vii

Remerciements x

Introduction 1

1 Revue de littérature 4

1.1 Cadre analytique . . . 4

1.2 Rendement du nombre d’années d’étude sur le marché du travail . . . 5

1.3 Contexte. . . 8

2 Données 9

2.1 Échantillonnage . . . 9

2.2 Analyse descriptive . . . 10

3 Méthodologie 13

3.1 Regression Discontinuity design . . . 13

3.2 Modèle d’estimation . . . 15

4 Résultats 23

4.1 Effet sur le salaire hebdomadaire (1980) . . . 23

4.2 Robustesse des résultats . . . 25

Conclusion 31

A Document historique contextuel 33

(6)

Liste des tableaux

2.1 Statistiques descriptives (personnes du nouveau et de l’ancien système) . . . 11

2.2 Logarithme du salaire hebdomadaire moyen . . . 12

3.1 Test de proportion (ancien vs nouveau système). . . 20

3.2 Test de proportion par intervalle (ancien vs nouveau système) . . . 21

4.1 RD design : Logarithme du salaire hebdomadaire . . . 24

4.2 Résultats de l’estimation du modèle pour d’autres années de recensement . . . 25

4.3 Résultats de l’estimation du modèle pour différents intervalles . . . 26

4.4 Résultats de l’estimation du modèle avec inclusion de variables explicatives . . . 27

4.5 Aperçu de la situation d’ambiguïté autour du seuil . . . 28

4.6 Résultats de l’estimation du modèle pour le seuil à 1946 . . . 29

4.7 Résultats de l’estimation du modèle pour le seuil à 1948 . . . 30

(7)

Liste des graphiques

(8)

(9)

L’amour du prochain sans l’amour de Dieu, c’est encore un corps sans ossature.

(10)

Remerciements

Je tiens à signifier en premier lieu toute ma gratitude à mon Seigneur et Sauveur Jésus-Christ pour sa présence dans ma vie. Je tiens aussi à remercier très particulièrement mon directeur Bernard Fortin et ma codirectrice de recherche Marion Goussé, pour leurs précieux conseils et orientations lors de la rédaction de mon mémoire. Je suis très reconnaissant envers mon Père Dogoua Sévérin et ma Mère Dogoua Gisèle, qui ont été pour moi un soutien ineffable. Mes pensées vont aussi à l’endroit de toute ma grande famille. Enfin, je désire remercier toutes les personnes qui ont contribué d’une quelconque manière à ce mémoire.

(11)

Introduction

Quel est l’effet d’une réduction d’une année de scolarité sur les salaires futurs ? Plusieurs travaux de recherche ont démontré l’importance des études universitaires sur l’employabilité et les salaires. Détenir un diplôme universitaire octroie plus de chances d’être en emploi et d’avoir un meilleur salaire comparativement aux diplômés du secondaire (Parent, 1999). Au Canada, les données sur l’éducation tirées de l’Enquête nationale auprès des ménages (ENM) de 2011 de Statistique Canada révèlent que le taux de chômage pour la population active est de 4,5% pour les diplômés du Baccalauréat, contre 5,2% pour les diplômés d’études non universitaires.En ce qui concerne le salaire réel, Berger et Parkin (2008) démontrent que sur un horizon de vie de 40 ans, un titulaire d’un baccalauréat gagnera environ 745 800 dollars de plus qu’un diplômé du secondaire. Dans la même optique, d’autres recherches se sont attardées sur les écarts de salaires. Les plus anciennes se sont inspirées de théories, et tentent d’expliquer la différence de salaire au sein d’un groupe d’individus, soit par une différence du niveau d’éducation (Becker, 1975), ou encore par l’expérience (Mincer, 1974). Cependant, des études plus récentes notamment celle de Thomas Lemieux (2014) montrent que le niveau de scolarité à lui tout seul ne peut constituer un facteur pertinent dans la compréhension des différents niveaux de salaire. Il faudrait qu’une personne exerce une fonction liée à son domaine d’étude pour que le diplôme influe sur le salaire. Cette divergence au sein des résultats met en évidence la difficulté à expliquer tous les écarts salariaux. Dans ce mémoire, nous nous appuyons sur la réforme du système éducatif québécois survenu en 1967, pour évaluer l’impact d’une réduction d’une année de scolarité sur les salaires.

Avant que le cours secondaire ne devienne gratuit, très peu de jeunes fréquentaient le cours classique qui était alors critiqué, et considéré comme étant peu adapté au monde moderne. En plus d’être inadéquat, il était restrictif, car réservé seulement à une élite. Suite à l’actualité socio-éducative qui prévalait dans les années 1950, le gouvernement Lesage a été amené à prendre en considération le travail réalisé par la commission royale d’enquête sur l’enseignement dans la province de Québec. Connue sous le nom de Commission Parent, la commission royale a été fondée dans le but de fournir aux autorités un récit détaillé de l’état des lieux, et des tentatives de solutions aux problèmes énumérés. Le travail se résumait à un rapport en cinq tomes, proposant une réforme efficiente du système éducatif québécois. Dans les faits, ce système croulait sous le poids des critiques compte tenu de son anachronisme, du manque de coordination entre les différents niveaux d’éducation, et de son incapacité à octroyer aux jeunes Canadiens francophones une entrée directe à l’université1_.

(12)

Ceci se faisait très bien en zone anglophone par l’intermédiaire du High School.

Les recommandations de la commission ont abouti à la création du ministère de l’Éducation en 1964. La réforme planifiée se mit en marche avec le ministère nouvellement mis en place, pour qu’en résulte en 1967 la création des Cégeps (collège d’enseignement général et professionnel) mettant fin au cours classique, et donnant un accès direct à l’université.

Nous nous intéressons donc de façon particulière au passage du cours classique au Cégep. À la base, le cours classique s’étalait sur une période de huit ans et était sanctionné par un baccalauréat ès arts. Avec l’avènement du Cégep, les cinq premières années de l’ancien système sont devenues les cinq années de l’enseignement secondaire. La sixième année fut supprimée et les deux dernières années devinrent les années Cégep2_{. Ceci a occasionné plus tard en 1968, la présence de deux}

cohortes d’étudiants en première année d’université : les derniers élèves à avoir fait au complet le cours classique, et la promotion d’élèves qui les suivait. D’un point de vue critique, on observe une différence d’intrant éducatif au sein de ces deux cohortes : une première cohorte où les jeunes ont réalisé les huit années du cours classique et une seconde où les autres ont seulement sept années d’étude, s’apparentant au nouveau système qui allait être mis en place. Ce système comportait plus précisément cinq années d’étude secondaire et deux ans de Cégep. À partir de ces deux cohortes, qui plus tard sur le marché du travail se présentent avec un niveau de diplomation similaire, nous contribuons à la littérature en apportant une explication plus claire de l’écart salarial, qui serait dû à une différence d’intrant pré-universitaire.

En arrière de la différence d’intrant éducatif créée par le changement de système, une autre situation pourrait susciter de l’intérêt. Il s’agit de celle qui met en relief le fait qu’avant l’arrivée sur le marché du travail, ces deux promotions ont eu un cursus universitaire commun. Il s’avère donc nécessaire de tenir compte d’un sureffectif dans les classes, par rapport aux personnes qui ont réalisé leurs études universitaires avant et après cette double cohorte.

Pour réaliser cette étude, nous nous servons des données de la division des opérations du recensement Statistiques Canada, sur le Recensement de la population de 1981 [Canada], fichiers de micro données à grande diffusion (FMGD) : Particuliers selon les régions métropolitaines de recensement. Avec le nouveau système mis en place autour des années 1967, on assiste à une réduction du nombre d’années de scolarité requis pour intégrer l’université. La conséquence immédiate anticipée est une baisse brusque dans les salaires, lorsqu’on porte l’attention sur les personnes issues des cohortes d’avant et après la réforme. La méthode empirique la mieux adaptée à ce genre de phénomène et qui sera utilisée dans ce mémoire est la Regression Discontinuity (RD) design. Cette méthode très robuste se trouve être une méthode d’estimation locale. L’estimation par RD révèle q’une année de scolarité en moins affecte négativement les salaires, de façon significative. Cet impact est juste valable pour les intervalles les plus proches du seuil.

Le reste de ce mémoire est structuré comme suit : dans le premier chapitre, nous présentons une revue de littérature des études empiriques. Ensuite au second chapitre, il est question de la base de données utilisée. Le chapitre 3 est axé sur une présentation sommaire de la méthode empirique

(13)

et des hypothèses qui sous-tendent son application. Le chapitre 4 est consacré aux estimations, à l’interprétation des résultats et à une analyse de robustesse.

(14)

Chapitre 1

Revue de littérature

Dans ce chapitre, nous présentons le cadre analytique en lien avec notre sujet, les résultats des travaux de recherche qui se sont intéressés à l’évaluation du rendement du nombre d’années d’étude sur le marché du travail, et une mise en contexte.

1.1 Cadre analytique

La majeure partie des études réalisées sur l’impact de la scolarité sur le salaire dans le domaine de l’économie du travail se sont basées sur la théorie du capital humain, théorie développée par Jacob Mincer (1958)[24]. Il détient l’appellation de pionnier dans le domaine de l’économie du travail empirique pour cette théorie qui se résume à son équation dite : l’équation de Mincer. Cependant, le modèle standard élaboré par Mincer, qui suppose que le salaire est fonction de l’expérience, du niveau d’éducation et des caractéristiques non observables, présente des lacunes dans l’explication de la totalité des rendements.

Mincer (1974)[25] soutient que l’expérience est la variable clé dans l’explication de la différence de revenu. Pour lui, la scolarité est d’une importance peu capitale. Aussi, il démontre une divergence du rendement de l’expérience entre les travailleurs, due au fait d’une différence d’investissement dans l’apprentissage sur le tas. Dans une autre approche, Becker (1967)[9] développe un modèle d’inves-tissement en capital humain où les travailleurs présentent des rendements hétérogènes d’éducation. S’appuyant sur ces spécifications, Lemieux (2006)[20] montre que le modèle de base est très restrictif, car il impose que les rendements de l’éducation et de l’expérience de travail soient homogènes pour tous les travailleurs. Il y intègre donc l’effet hétérogène.

Plusieurs autres études ont été menées sur la validité du modèle de base de Mincer pour juger de sa pertinence à expliquer les phénomènes observés de nos jours. Murphy et Welch (1990)[27] sou-tiennent que l’équation de Mincer donne une approximation totalement discutable de la véritable

(15)

relation entre le salaire et l’expérience. D’autre part, Andini (2010)[2] atteste qu’une spécification dynamique de l’équation de Mincer serait préférable. Il argumente en faveur de l’ajout de la variable retardée du salaire dans le modèle de base. Cette approche permet d’avoir une explication plus viable du fait que le rendement de l’éducation ne soit pas indépendant de l’expérience de travail. Orrenius et Zavodny (2015)[30] utilisent une fonction quartique de l’âge comme spécification de l’expérience dans leur étude sur l’influence du statut de protection temporaire sur le revenu des immigrants. Pour notre étude, nous nous basons sur les résultats de Lemieux (2006b)[21], dans laquelle il évalue les performances du modèle de base de Mincer, trente ans après son élaboration. Il conclut que ce modèle demeure utile pour les études contemporaines, mais serait plus efficace si on l’ajustait. Ainsi l’ajustement consiste à inclure : une fonction quartique du nombre d’années d’expérience en substitut de la fonction quadratique initialement utilisée, qui permettrait de ne pas sous-estimer l’expérience des jeunes travailleurs ; une fonction quadratique du nombre d’années d’étude pour inclure la convexité entre la scolarité et le salaire. L’équation formalisée se présente comme suit :

LogWit= αi+ β1tDi+ β2tD2i + γ1tExpi+ γ2tExp2i + γ3tExp3i + γ4tExp4i + µit

où :

– α :les caractéristiques non observables ou qualifications individuelles.

– Di:le nombre d’années d’étude relatives à l’obtention d’un diplôme ou grade universitaire.

– Expi :l’expérience sur le marché du travail.

– µit:le terme d’erreur.

Ce modèle est pertinent pour notre étude. En effet, l’estimation de l’effet de la réduction d’une année de scolarité dans notre travail nécessite l’utilisation de la fonction quartique. La justification est que l’analyse économétrique se sert de données recueillies dans les années qui ont suivi le chan-gement du système éducatif. Assurément, de très jeunes travailleurs font partie de la base de données.

1.2 Rendement du nombre d’années d’étude sur le marché du

travail

La sphère des économistes du travail a grandement œuvré pour l’explication du rendement de la scolarité, compte tenu de l’enjeu grandissant vis-à-vis de l’investissement dans le domaine de l’édu-cation, et des retombées pour la société. La littérature économique fournit donc un large éventail d’explications de la différence de niveau d’étude, perçut comme la principale variable responsable des écarts salariaux entre les travailleurs.

Des études faites sur le rendement de la scolarité sur le marché du travail au niveau des individus, il ressort un accord des chercheurs. En effet, partant de diverses spécifications, plusieurs économistes

(16)

ont montré que le rendement de l’éducation variait selon les niveaux d’études qui faisaient l’objet de la comparaison. L’écart entre les salaires s’accentue au fur et à mesure que l’on s’intéresse à des classes de travailleurs de plus en plus éduqués (Mincer, 1994[26] ; Autor et al., 2005[7]).

D’autres chercheurs comme Bar-Or et al. (1995)[8], Vaillancourt (1995)[36] et Parent (1999)[31] ont également étudié le rendement de l’éducation au Canada. Si pour certains, l’attention était portée sur la question de la différence de salaire entre les décrocheurs et les diplômés du niveau secondaire, d’autres ont plutôt comparé les salaires des diplômés du secondaire à celui des diplômés universitaires. Leurs résultats sont tous conformes à ceux des travaux cités précédemment ; il n’y a pas de particularités relatives au Canada.

Dans le même ordre d’idées, Lemieux (2006)[21] confirme ces résultats, grâce à un modèle avec rendements hétérogènes, où il arrive à mieux expliquer la dispersion des salaires entre les différents groupes de qualification. Stark (2007)[34], quant à lui, mène une analyse plus désagrégée. Il étudie le rendement de la scolarisation par diplôme, par sexe et par discipline de formation. À partir des données du recensement canadien de 1996, il conclut que le rendement des études varie selon les disciplines universitaires. Par ailleurs, les études de Psacharopoulos et Patrinos (2004)[33], King, Montenegro et Orazem (2012)[16] contribuent à cette littérature en estimant le rendement de la scolarité dans plusieurs pays à la fois. Malgré les différentes méthodes d’estimation, et les différences de niveau de développement, ces études aboutissent sensiblement à la même conclusion : les revenus augmentent avec le niveau de scolarité atteint.

En outre, il est important de mentionner que l’analyse de l’effet de la scolarisation sur le revenu est sujette à un problème d’auto-sélection. En effet, la décision de poursuivre, ou même de réaliser des études n’est pas aléatoire, elle dépend généralement de caractéristiques inobservables.

D’une part, Ashenfelter et Krueger (1994)[5], Ashenfelter et Rouse (1998)[? ], Krashinsky (2004)[17], se servent d’une base de données sur des jumeaux parfaitement identiques pour résorber ce problème d’auto-sélection. Le but dans ce cas d’études est de contrôler pour les habiletés familiales afin d’es-timer l’impact de la scolarisation sur les revenus, sans biais.

D’autre part, certains auteurs d’études empiriques ont essayé de résoudre ce problème par l’approche de Variables Instrumentales (IV). Card (1993)[10], Connely et Uusitalo (1997)[11], utilisent la proxi-mité à une ville universitaire comme instrument de l’éducation. Un autre exemple d’étude avec cette approche est le papier de Angrist et Kruger (1991)[3], où ils utilisent la méthode IV, pour corriger le biais de sélection. S’appuyant sur la loi de la scolarité obligatoire jusqu’à 16 ans aux États-Unis, ils utilisent le trimestre de naissance comme instrument de l’éducation afin de mesurer le réel impact du nombre d’années d’étude sur le salaire. La conclusion de leur travail est que le rendement d’une année de scolarité en plus est d’environ 10%. Tous ces auteurs font l’hypothèse que leurs instruments ont un pouvoir explicatif sur la probabilité de réaliser des études supérieures, mais n’ont aucun lien avec le revenu.

Suivant cette même perspective, Oreopoulos (2006)[29] estime l’effet moyen du rendement de l’édu-cation, à partir du changement de loi sur l’âge minimum pour arrêter les études dans plusieurs pays.

(17)

Au vu des nombreuses critiques dont souffre la méthode IV, Oreopoulos mène une série de tests sur les données américaines (USA) et canadiennes pour juger de l’ampleur de la variation des résultats selon que les estimations sont faites soit par Moindres Carrés Ordinaires (MCO) ou par IV. Après ce test, l’auteur approfondit son analyse en estimant l’effet moyen local de l’éducation par la Re-gression Discontinuity (RD) design, avec les données du Royaume-Uni (U.K). Au terme de toutes ses analyses, il trouve des effets positifs rattachés à une année d’étude supplémentaire, de 14.2%, 15.8%, et 9.6% respectivement pour les USA, U.K et le Canada.

Cependant, même si un accord semble être trouvé au sein de la littérature empirique sur le rendement des études, une forme d’ambigüité subsiste. La pluralité des instruments utilisés, ainsi que les groupes de personnes faisant l’objet des différentes études, pourraient être à l’origine de cette ambigüité. Ainsi, Pischke et von Wachter (2008)[32] ont évalué l’impact d’une année d’étude supplémentaire sur le salaire, à partir d’une réforme du système éducatif. Après la seconde guerre mondiale, la durée des études au secondaire est passée de huit années à neuf années en Allemagne. Tout comme dans l’étude de Acemoglu et Angrist (2000)[1] aux États-Unis, cette réforme donne l’opportunité aux chercheurs d’avoir deux groupes d’individus au sein de la population en limitant en partie le biais de sélection, et d’évaluer empiriquement le changement de système éducatif. Avec deux bases de données différentes, les auteurs estiment l’effet causal d’une année supplémentaire en procédant exactement comme leurs précurseurs ; c’est-à-dire utiliser la réforme éducative comme instrument du nombre d’années d’études. Contrairement aux études réalisées par Angrist et Krueger (1991), Acemoglu et Angrist (2000), Oreopoulos (2006), les résultats des auteurs attestent qu’une année en plus n’a aucun effet sur les salaires. Ces résultats sont robustes à une série de différentes spécifications, à travers plusieurs grands ensembles de données, et leurs résultats principaux sont précisément estimés. Par la suite, Kamhöfer et Schmitz (2013)[15] réanalysent l’effet de l’éducation sur les salaires en Allemagne à partir d’un panel socioéconomique. Aux instruments déjà utilisés par Pischke et von Wachter (2008), les auteurs ajoutent deux autres qui captent l’environnement institutionnel et l’équi-pement scolaire dans le but de combler les limites de l’estimateur local trouvé, de sorte à favoriser une plus grande validité externe. De plus, ils testent directement l’hypothèse de Pischke et von Wachter (2008) selon laquelle le manque de formation qualifiée pourrait être une raison du rendement nul constaté dans les données allemandes, en estimant l’effet causal de l’éducation sur les capacités cog-nitives. Leurs résultats sont conformes aux études antérieures sur l’Allemagne : une année d’étude en plus n’a aucun effet sur le salaire.

(18)

1.3 Contexte

En 1967, le gouvernement provincial du Québec a adopté une réforme du système éducatif. Cette ré-forme s’est concrétisée par l’avènement des Cégeps. Avant la création des Cégeps, le jeune québécois qui souhaitait entreprendre des études supérieures devait obligatoirement terminer le collège clas-sique, car c’était le seul canal d’entrée à l’université. À l’époque, le système éducatif était composé de l’enseignement primaire, assuré par des religieuses, et de l’enseignement secondaire, à la charge des jésuites. Par la suite, il devint le collège classique. C’était un cours privé, d’une durée de huit ans, réservé à une élite, et se donnant dans des séminaires. La plupart des collèges proposaient un programme entièrement réservé aux garçons, et divisé en deux étapes de quatre années chacune : d’abord une formation secondaire et ensuite une formation collégiale équivalente au baccalauréat ès arts offert dans les universités française. À la fin de ses études, l’étudiant recevait un diplôme qui lui permettait de s’inscrire à l’université,3 _{ou encore de s’orienter vers la prêtrise ou une profession}

libérale. Pour les filles, il y avait des écoles où elles pouvaient se préparer à être une bonne maîtresse de maison, une infirmière, une institutrice ou une secrétaire. Dans le programme d’étude, l’étudiant était formé principalement en disciplines littéraires tout au long des six premières années, et en disciplines philosophiques les deux dernières années. Dans la foulée du rapport Parent à l’origine de la réforme du système d’enseignement au Québec, les cinq premières années d’étude devinrent le secondaire actuel, la sixième année fut supprimée et les deux dernières années furent destinées à une formation pré-universitaire au travers des Cégeps nouvellement instaurés.

L’élimination de la sixième année du programme dans le collège classique a une incidence perti-nente sur l’intrant éducatif. En effet, puisque le nombre d’années dédiées aux études constitue cet intrant, la réduction d’un an dans le nouveau cursus vient modifier sa composition. Suite à cette réforme, nous observons la présence de deux groupes d’individus à savoir la génération des per-sonnes qui ont effectué des études universitaires avant les Cégeps et celle d’après les Cégeps. Avec ces deux générations différenciées par les Cégeps, on remarque la présence de personnes ayant un même diplôme universitaire, mais un intrant éducatif différent. Cet aspect particulier nous permet d’évaluer l’impact d’une réduction d’une année d’étude sur les salaires futurs, sans avoir de biais d’auto-sélection.

(19)

Chapitre 2

Données

Pour analyser l’impact de la réduction d’une année d’étude sur les salaires, nous utiliserons les données de la division des opérations du recensement Statistique Canada, sur le Recensement de la population de 1981 [Canada], fichiers de micro données à grande diffusion (FMGD) : Particuliers selon les régions métropolitaines de recensement.

Le recensement est une enquête générale universelle, effectuée tous les cinq ans, dans la première semaine du mois de juin. Un grand questionnaire est distribué à environ 20% des ménages. À partir des données recueillies, Statistique Canada publie les FMGD. Il existe trois fichiers : le Fichier des particuliers, le Fichier des familles et le Fichier des ménages et du logement. Le Fichier des particuliers de 1981 renferme des caractéristiques économiques et démographiques, ainsi que des informations sur l’éducation, la famille, le logement, relatives à chaque particulier compris dans l’échantillon. Il contient au total 486875 observations et 102 variables.

2.1 Échantillonnage

Nous considérons le fichier des particuliers issu du recensement de la population de 1981 pour per-mettre à notre échantillon d’avoir en son sein, différents niveaux d’éducation. La première promotion à avoir juste treize ans d’intrant éducationnel est entrée à l’université à l’automne 1968. Sur cette base nous supposons que la graduation au baccalauréat de cette promotion aura lieu trois ans plus tard, en 1971. Pour la diplomation à la maîtrise, deux ans plus tard, en 1973 et pour le doctorat en 1977 ou 1978. Le recensement de l’année 1981 semble le plus pertinent pour commencer notre analyse. À ce niveau, nous posons une hypothèse sur le parcours académique : l’âge d’entrée à l’école primaire est de six ans ; le primaire s’effectue en six années et débouche sur le cours classique d’une durée de huit années dans l’ancien système. Pour le nouveau système, nous comptabilisons sept années, soit cinq ans de cours secondaire et deux ans de Cégep. Aussi, nous excluons la possibilité

(20)

de reprise d’une quelconque année d’étude durant tout le parcours pré-universitaire. On suppose également qu’il n’y a pas de migration post diplomation, et qu’il n’y a pas d’étudiants qui vont faire leur étude universitaire ailleurs au Canada. Sous ces hypothèses, les personnes venant du cours clas-sique débutent la première année d’étude universitaire à l’âge de vingt ans ; tandis que les personnes du nouveau système à dix-neuf ans. Par la suite, notre étude concerne les personnes en provenance du système éducatif du Québec alors que le recensement porte sur tout le Canada. À partir des variables géographiques, indiquant la province et le lieu de résidence lors des recensements précé-dents de chaque particulier, nous pouvons restreindre notre échantillon à la population concernée. Nous utilisons les données de recensements des années 1986, 1996, et 2001, également fournies par Statistique Canada pour une analyse de robustesse.

De plus, nous nous intéressons aux hommes, compris entre dix-neuf et soixante-quatre ans, qui ont effectué des études universitaires. Cette étude porte seulement sur les hommes, du fait qu’à l’origine, le cours classique, unique canal donnant accès à l’université au Québec, était majoritairement réservé aux garçons. Nous limitons notre échantillon à cette tranche d’âge parce que soixante-cinq ans est l’âge de la retraite, et dix-neuf ans, selon nos hypothèses prédéfinies, l’âge d’entrée à l’université. Le but de ce mémoire, étant de mettre en exergue l’impact d’une année d’étude sur les salaires, nous avons supprimé de la base de données les personnes qui ont déclaré un salaire nul, ou qui n’ont pas déclaré de salaires. En effet, la déclaration d’un salaire est possiblement liée à l’éducation. Notre échantillon pour cette étude est donc de 1201 personnes, soit 3% de l’ensemble des Québécois de cette tranche d’âge.

2.2 Analyse descriptive

L’analyse descriptive de l’échantillon est effectuée à partir du tableau2.1. Nous y présentons des va-riables telles que le niveau de scolarité ou diplômes universitaires obtenus, l’expérience sur le marché du travail, et la profession, pour le recensement de 1981 et également pour les autres recensements. Ces variables sont les plus utilisées dans la littérature qui porte sur les écarts salariaux entre diffé-rents groupes de personnes. De plus, nous nous intéressons à d’autres caractéristiques individuelles à savoir le statut matrimonial, la ou les langues officielles du Canada maîtrisées, et l’origine. Elles nous permettront de mieux saisir le degré d’homogénéité de nos deux groupes.

La comparaison des colonnes (NV) et (ANC) montre qu’en général, les personnes issues du nou-veau système éducatif préuniversitaire ont en majorité un diplôme de Baccalauréat, soit 67,4% en termes de proportion de leur effectif, contre 41,13% pour les gens de l’ancien système. Au niveau des autres diplômes, la différence la plus évidente concerne la proportion de titulaires de diplôme d’études supérieures (2e et 3e cycle), celle-ci étant de 26,8% pour les personnes de l’ancien système et 13,07% pour les autres. Concernant le nombre d’années d’expérience sur le marché du travail, nous observons un grand écart entre les deux groupes. Les anciens ont en moyenne 19,4 ans d’expé-rience, contrairement aux nouveaux qui ont juste 5,8 ans comme expérience moyenne. Cette grande

(21)

Tableau 2.1 – Statistiques descriptives (personnes du nouveau et de l’ancien système) 1981 NV. ANC. Scolarité (%) CIB 10,57 16,33 BAC 67,45 41,13 CSB 8,9 15,73 M.,DI.,Doc 13,07 26,81 Expériences (%) 5,8 19,71 Âge (%) 28,2 42,28 Occupation (%) Gestion 21,97 31,85 Commerce 14,13 10,08 Fabrication 2,64 1,41 Santé 5,98 3,23 Éducation 16,69 21,77 Administration 4,31 3,02 Arts 3,48 3,23 Autres 32,68 21,98 Autres caractéristiques Statut (%) personnes seules 27,68 25,1 en couples 72,32 74,6 Langues officielles (%) Français 25,87 15,32 Anglais 2,78 6,65 Bilingues 71,21 78,02 Origines (%) Autochtones 92,21 79,26 Immigrants 7,79 20,74

CIB : Certificat d’études Inférieur au Baccalauréat BAC : Diplôme du Baccalauréat

CIB : Certificat d’études Supérieur au Baccalauréat

M., DI. et Doc : Diplômes de Médecine, Maîtrise et Doctorat

différence s’explique par le fait que les personnes du nouveau système sont nécessairement des per-sonnes nées après 1947, selon notre hypothèse sur le parcours académique. De cette circonstance,

(22)

résulte la présence majoritaire de jeunes diplômés en 1981 pour ce groupe, sachant que l’expérience est donnée par l’âge diminué du nombre d’année d’étude et de 6 ans, l’âge d’entrée au cours primaire. Par ailleurs, nous portons aussi notre attention sur la profession exercée par les personnes de notre échantillon. Il est nécessaire de prendre en compte cette variable de sorte à inclure l’idée selon laquelle le rendement de l’éducation varie selon la profession4_{. Ainsi, l’analyse descriptive de l’occupation}

nous révèle que le domaine de la gestion est celui qui englobe le plus grand nombre de personnes de l’ancien système et du nouveau système, soit 31,8% et 21,9% de leurs effectifs.

La suite des informations du tableau montre que pour les autres caractéristiques observables, nous avons en général des proportions plus ou moins similaires dans chaque groupe. Cependant, il convient de noter que 20,7% des gens de l’ancien système sont des immigrants, tandis que dans l’autre groupe nous avons 7,8% d’immigrants.

2.2.1 Le salaire

Dans la base donnée, nous avons les informations sur le salaire annuel des personnes et le nombre de semaines travaillées l’année précédant celle du recensement. À partir de ces informations, nous obtenons le salaire hebdomadaire, qui sera notre variable d’intérêt.

Tableau 2.2 – Logarithme du salaire hebdomadaire moyen

global NV ANC

Salaire moyen 6,87 6,7 7,12

Nombre d’observations 1201 703 488

Le tableau2.2montre que le salaire moyen hebdomadaire pour les anciens est 1236,45 $ et largement supérieur au salaire moyen hebdomadaire des nouveaux qui est de 812,40 $ . Conformément à la théorie économique, cet écart pourrait s’expliquer par des différences de niveau de scolarisation, du nombre d’années d’expérience, ou encore par une différence de profession exercée, entre les gens de l’ancien système et ceux du nouveau système.

(23)

Chapitre 3

Méthodologie

3.1 Regression Discontinuity design

Pour analyser l’impact qu’aurait pu avoir le changement de système éducatif sur les salaires, nous utiliserons une méthode économétrique d’estimation locale. Malgré l’utilisation récente de cette mé-thode dans les études d’impact de politiques, son origine date de 1960, où elle a été utilisée pour la première fois dans les travaux de Thistlewaite et Campbell (1960)[35], en psychologie. Leur étude était basée sur l’effet de la réussite scolaire sur le devenir des étudiants, en prenant en compte l’octroi de bourses à ces derniers, sous le critère de performance à un examen. En dépit de la pertinence et la puissance de cette méthode, elle est tombée dans l’oubli jusqu’à la fin des années 90. La RD design fut adoptée par l’économie à la suite de travaux empiriques d’Angrist et Lavy (1999)[4] sur l’impact de la taille de la classe sur la réussite scolaire, de Black (1999) avec son étude sur la carte scolaire et les prix de logement, et de Van der Klaauw (2002)[37], s’intéressant lui aussi à l’éducation. Par la suite, elle a été approfondie par d’autres chercheurs comme Imbens et Lemieux (2008)[14], qui ont posé les bases et les conditions nécessaires à l’utilisation de cette méthode.

La RD design tient sa percée en économie, du fait de sa facilité à mener à bien l’évaluation de politiques économiques qui disposent d’un seuil dans la sélection des personnes traitées, créant ainsi une discontinuité dans la probabilité de recevoir le traitement. Cette méthode s’appuie sur le fait qu’aux alentours du seuil, il y a de très grandes chances que les individus qui s’y trouvent présentent les mêmes caractéristiques.

Comme le souligne la littérature économique, le véritable problème de l’évaluation empirique d’im-pact se situe dans la détermination de l’effet causal. Le fait d’être assujetti à une politique publique, communément appelée traitement, suppose que l’effet de ce traitement s’obtiendrait en faisant la différence des revenus. Un individu de la population qui reçoit le traitement a un revenu Yi(1), et

(24)

états simultanément. Aussi, il existe généralement deux groupes de personnes dans la population : les personnes traitées et les personnes non traitées. Estimer l’effet du traitement par la différence de revenus entre le revenu moyen du groupe traité et celui du groupe non traité serait une estimation biaisée. Le fait est qu’il est fort probable que les personnes traitées le soient parce qu’elles anticipent un meilleur revenu en recevant le traitement et les non-traitées ne le soient pas également parce qu’elles anticipent un revenu plus faible. Dans les études non expérimentales, il est difficile de penser que l’affectation à un groupe se fait aléatoirement. Mais avec la RD design, il est possible de capter l’effet causal d’un traitement en comparant les personnes proches du seuil.

Formellement, on s’intéresse à l’effet du traitement sur une variable y (le revenu) : Yi= α + ∆i.Ti+ µi

où ∆i est l’effet du traitement pour l’individu i (Yi,1− Yi,0). La variable de traitement qui

générale-ment est une variable binaire (T= 1 pour les traités et T= 0 pour les non traités) nous permet de distinguer deux cas lorsqu’on veut appliquer le modèle de régression discontinue.

Le premier cas est le Sharp design, où le traitement est reçu dépendamment de la variable de sélection S, qui attribue à chaque individu la distance à laquelle il se trouve du cutoff (seuil C) ou de la probabilité d’être traité. Franchir le seuil donne le droit au traitement, donc implique qu’on le reçoive effectivement. Le traitement est fonction de la variable de sélection :

Ti = TSi = 1 quand Si> C

Ce cas typique apparait la plupart du temps dans la littérature qui traite des dispositifs de sélection dépendant de l’âge. Lalive (2008)[18] utilise le Sharp design dans son étude sur l’impact des indem-nités au chômage sur le retour à l’emploi en Autriche. Le montant que reçoivent les chômeurs diffère selon l’âge auquel survient la perte d’emploi. Les personnes âgées de 50 ans et plus au moment de leur licenciement ont des indemnisations plus élevées que ceux de moins de 50 ans. Il exploite donc la discontinuité à 50 ans.

Le second cas est le Fuzzy design, où le traitement est toujours reçu, dépendamment de la variable de sélection, mais l’affectation au groupe traité ou au groupe non traité n’est plus parfaite. Dans bien des cas d’étude, des ayants droit au traitement ne l’ont pas, tandis que certaines personnes n’ayant pas franchi le seuil en bénéficient. L’exemple classique de la littérature est celui de Van der Klauw (2002), dans son étude sur le montant offert en bourse à des étudiants par une grande université américaine. Le montant de la bourse reçue est fonction du score obtenu par l’étudiant à un examen. Les étudiants sont donc classés en plusieurs groupes selon leur score. De ce fait, ceux

(25)

qui sont très proches des différents seuils de part et d’autre sont susceptibles d’avoir les mêmes performances, parce qu’ils ont des scores très proches, mais auront le choix entre des bourses de différents montants. Cependant, l’attribution des bourses n’est pas parfaitement déterminée par la variable de sélection car le montant peut varier selon que d’autres caractéristiques rentrent en ligne de compte dans la détermination du montant de la bourse. Dans ce mémoire, la question de l’impact d’une année de scolarité en moins sera étudiée par un Sharp Regression Discontinuity design. Le traitement (T = 1 pour le groupe d’individus qui a été aux études sous l’ancien système, et 0 pour l’autre groupe qui dénombre une année en moins) dépend de manière déterminante de la variable de sélection S. Les personnes qui, à l’époque avaient suivi l’ancien système sont difficilement identifiables dans la base de données. La répartition en fonction du groupe de traitement et du groupe contrôle est faite à partir de l’année de naissance. L’hypothèse selon laquelle les élèves débutent à l’âge de six ans la première année du primaire, implique que dans l’ancien système, les élèves faisaient quatorze années d’étude avant d’intégrer l’université et qu’ils en font treize dans le nouveau. Le groupe des traités est donc composé des personnes ayant débuté la première année universitaire à vingt ans et celui des non traités, des personnes débutant la première année à dix-neuf ans. Rappelons que nous excluons la possibilité de reprendre une quelconque classe. La dernière promotion d’élèves de l’ancien système, entrée à l’université à vingt ans en 1967 nous permet de limiter le groupe de traitement aux personnes nées en 1947 (seuil) et avant. Pour les personnes nées à partir de 1948, il s’agira donc du groupe contrôle.

3.2 Modèle d’estimation

L’estimation de l’effet de traitement à partir du RD design peut se faire à partir de deux méthodes distinctes. Le choix de la méthode est quant à lui tributaire de la quantité d’observations autour de la discontinuité. Comme ce modèle se base sur l’existence d’un seuil au-delà duquel on assiste à un changement brusque dans le revenu, une estimation robuste de l’effet du traitement s’obtient lorsqu’on travaille avec les valeurs localement proches du point de discontinuité. L’estimation non paramétrique est donc recommandée (Hahn et al., 2001 ; Porter, 2003). Cependant, lorsqu’on a très peu d’observations proches du seuil, certains chercheurs s’éloignent peu à peu, afin d’avoir un estima-teur de l’effet du traitement. Le problème à ce niveau est que la composante inobservable présentée antérieurement, qui doit être continue autour du seuil, ne l’est plus forcément lorsqu’on s’éloigne de ce seuil. Une estimation paramétrique dans ce cas est utilisée. Le débat scientifique montre que ces deux méthodes d’estimation sont valides étant donné que le choix se fait réellement par arbitrage. Estimer un effet de traitement avec très peu d’observations au point de discontinuité permet d’avoir un estimateur sans biais, mais peu précis. À l’opposé, lorsqu’on s’éloigne du seuil on a plus d’ob-servations, donc un estimateur plus précis, mais biaisé. Un exercice de validation croisée est donc recommandé pour faire un bon arbitrage.

Dans notre étude, nous estimons l’effet du traitement à partir d’un modèle paramétrique, pour trois bandwidths différents :

(26)

• 4 années d’écart de part et autre du seuil ; c’est-à-dire les personnes nées entre 1943 et 1951 • 8 années d’écart de part et autre du seuil ; c’est-à-dire les personnes nées entre 1939 et 1955 • 12 années d’écart de part et autre du seuil ; c’est-à-dire les personnes nées entre 1935 et 1959. Notre première fenêtre débute à 4 années d’écart, du fait que pour les fenêtres inférieures, le nombre observations est très restreint ce qui rend l’estimation impossible.

3.2.1 Estimation paramétrique

Cette approche puise son sens dans le fait que dans les études empiriques, on a généralement très peu d’observations au voisinage de la discontinuité. Par exemple dans la littérature, lorsque la va-riable de sélection se mesure par des valeurs discrètes, l’on doit obligatoirement imposer une forme fonctionnelle ; l’estimation non paramétrique devient inappropriée. Aussi, cette littérature fait res-sortir l’idée selon laquelle plusieurs chercheurs, pour résoudre ce problème, utilisent volontairement des échantillons plus larges, tout en contrôlant la dépendance du revenu dans la variable de sé-lection par des régressions polynomiales. Cependant, le fait d’imposer une forme fonctionnelle crée une ambiguïté sur la qualité d’ajustement du modèle (Lee et Card, 2008). Il convient d’effectuer des tests pour obtenir la meilleure spécification. L’estimation paramétrique se fait aisément. Plus précisément, pour obtenir l’effet du traitement, il suffit de faire une régression de chaque côté du seuil, de la variable dépendante sur la variable de sélection. À gauche :

Yg = αg+ βgBirth + µ (3.1)

où Yg est la variable dépendante pour le groupe des traités (les personnes de l’ancien système) et

Birth la variable d’assignation.

Parallèlement, nous pouvons modéliser la régression du côté gauche du seuil par l’équation suivante :

Yd= αd+ βdBirth + µ (3.2)

où Yd est la variable dépendante pour le groupe contrôlé (les personnes du nouveau système) et

Birth la variable d’assignation.

Enfin, l’effet de traitement s’obtient par la différence des espérances conditionnelles de Yg et Yd au

point seuil. Pour une présentation plus simple, la variable Birth prend la valeur 0 lorsque l’année de naissance est 1947 (le seuil). Quand il s’agit des personnes nées avant 1947, Birth prend des valeurs négatives et pour celles nées après 1947, des valeurs positives. Ces valeurs expriment les écarts entre l’année de naissance de chaque individu et le seuil. On obtient :

τ = E[Yg|Birth = 0] − E[Yd|Birth = 0] = αg− αd (3.3)

Il est aussi possible d’obtenir l’effet de traitement en une seule manipulation :

(27)

où :

Y : la variable dépendante (le salaire)

T : la variable binaire du traitement (prenant la valeur 1 pour les personnes qui ont reçu le traitement, et 0 sinon)

αg : la constante lorsqu’on est à gauche du seuil

βg : le coefficient de la variable de sélection quand on est à gauche du seuil

βd: le coefficient de la variable de sélection quand on est à droite du seuil

µ : l’erreur

τ : l’effet du traitement.

T.(Birth) est l’interaction entre la variable de traitement et la variable d’assignation qui permet le changement de pente lorsqu’on passe du groupe traité au groupe contrôle, en franchissant le seuil. La forme générale de l’équation3.4lorsqu’on fait varier l’ordre polynomial de la variable d’assignation est : Y = αg+ τ.T + n X i=1 βgn.(Birth) n₊ n X i=1 (βgn− βdn).T.(Birth) n_{+ µ} _(3.5)

3.2.2 Condition d’application du Sharp design

Les hypothèses nécessaires pour utiliser cette technique sont assez générales et facilement vérifiables, contrairement aux autres méthodes d’estimation non expérimentale, (Van der Klaauw, 2002). Il faut qu’un saut soit observé au niveau du seuil dans la variable qui fait l’objet de l’analyse (le loga-rithme du salaire hebdomadaire dans notre cas). Le graphe 3.1 le présente. A ce point, on change brusquement d’allure en passant d’un revenu sans traitement à un revenu avec traitement. Il s’agit de l’année de naissance 1947 sur l’axe des abscisses. Sachant que, la variable de sélection est une variable discrète, le nuage de point représente des moyennes de la variable dépendante, calculées chaque année de naissance. Du côté gauche du seuil nous avons la droite de régression des personnes qui ont le cursus pré-universitaire le plus long, et du côté droit la droite de régression des personnes dont le cursus pré-universitaire a été réduit d’un an.

(28)

Graphique 3.1 – Graphique de la discontinuité dans le salaire

Aussi, aucune autre des variables explicatives de la variable d’intérêt ne devrait présenter un saut au seuil. Elles doivent donc être toutes continues au niveau du cutoff, de sorte que la discontinuité dans le revenu ne soit expliquée que par le traitement. Cette première hypothèse ne pourrait être respectée seulement si les individus présents autour du seuil sont parfaitement comparables. En effet, si de part et d’autre du seuil il existe des personnes qui présentent des sauts au niveau du seuil dans les variables qui expliquent leur revenu, il serait difficile de conclure que le saut dans le revenu est seulement dû au traitement. De même, il faut aussi que la composante inobservée du revenu E(µi|S)

soit continue au seuil C :

lim S→C < E(µi|S) = lim S→C > E(µi|S) (3.6)

L’égalité entre la limite à gauche par valeur inférieure et la limite à droite par valeur supérieure de la composante inobservée du revenu, garantit effectivement la continuité de celle au seuil C. L’effet du traitement en ce point est donc :

E(∆i|S = C) = lim S→C < E(Y |S) − lim S→C > E(Y |S) (3.7)

À partir de cette expression, on remarque bien que l’effet du traitement est calculé exactement au point de rupture C. Nous convenons qu’il s’agit bien d’un estimateur local. En effet, les hypothèses

(29)

d’application citées ci-dessus justifient cet aspect local lorsqu’on s’attarde sur la vérification des ca-ractéristiques autour du seuil. L’interprétation de cet estimateur local est juste lorsqu’il s’agit d’un traitement constant dans l’ensemble de la population.

En pratique, il est plutôt aisé de vérifier si les groupes traités et non traités sont homogènes en moyenne ou en proportion dans leurs caractéristiques observables, autour du seuil. Une façon simple de le faire serait une régression de chacune des variables de contrôle sur le traitement et sur la variable de sélection. Autrement dit, cela reviendrait à faire un test de Student (ttest) de sorte à voir si on a une égalité des moyennes entre les traités et non-traités, étant donné qu’on se trouve proche du seuil pour chacune des caractéristiques observées.

Le tableau 3.1 nous présente les résultats du test pour certaines caractéristiques. Nous constatons qu’en général les deux groupes comparés présentent des différences de proportions significatives. Par exemple, les personnes ayant un diplôme d’étude supérieure dans le groupe traité ont un effectif beaucoup plus grand que celui des personnes du groupe contrôle. Aussi, les individus de l’ancien système sont plus nombreux à avoir plus d’années d’expérience. Ceci est attendu puisque les per-sonnes de l’ancien système sont entrées beaucoup plus tôt sur le marché du travail, par rapport aux personnes du nouveau système, tout ceci étant basé sur l’âge. Nous remarquons que ceux-ci ont tous plus de 4 ans d’expérience, et qu’aucune personne du nouveau système n’a atteint plus de 15 ans d’expérience. Raison pour laquelle le tableau ne présente pas de statistique de comparaison pour les tranches de 1-3 ans, 3-5 ans et 15 ans et plus.

Voyons maintenant comment se présentent ces différences mises en exergue ci-dessus, quand on s’attarde sur les personnes des deux groupes, plus proches du seuil.

Comparons trois intervalles : les personnes nées 4 ans avant et après 1947 ; celles nées 8 ans avant et après 1947 et les gens nés 12 ans avant et après (tableau 3.2).

Au fur et à mesure qu’on se rapproche du seuil, nous remarquons que les deux groupes sont de plus en plus identiques dans les caractéristiques. Par exemple, les différences observées dans les propor-tions de personnes ayant un Certificat d’études universitaires inférieur au Baccalauréat (CIB) pour les intervalles de 12 et de 8 ans, disparaissent lorsqu’on resserre jusqu’à l’intervalle de 4 ans. Il en est de même pour les personnes détenant un diplôme d’étude supérieure. Par contre, même jusqu’à 4 ans d’intervalle, une différence de proportion statistiquement significative demeure entre les groupes pour les diplômés du Baccalauréat et du Certificat d’études universitaires supérieur au Baccalauréat (CSB). Il est possible que ces différences créent un biais d’estimation de l’effet de traitement. Pour l’expérience, force est de constater qu’il faut resserrer jusqu’à 2 ans avant et après le seuil pour avoir des proportions plus ou moins identiques. Cependant, à cause du faible nombre d’observations dans cette tranche nous ne pouvons effectuer de test de proportion. Du reste, pour la profession et les autres caractéristiques, aucune différence statistiquement significative n’est observée lorsqu’on considère l’intervalle de 4 ans.

(30)

Tableau 3.1 – Test de proportion (ancien vs nouveau système) Total Échantillon NV ANC T.TEST Scolarité (proportion) CIB 0,1 0,16 0,006** BAC 0,674 0,416 0,000*** CSB 0,058 0,134 0,000*** MA 0,11 0,204 0,000*** DI 0,03 0,022 0,39 DOC 0,015 0,063 0,000*** M - D 0,161 0,289 0,000*** Experiences (proportion) 1 - 3 ans 0,179 - -3 - 5 ans 0,186 - -5 - 7ans 0,1905 0,0061 0,000*** 7 - 10 ans 0,286 0,0571 0,000*** 10 - 15 ans 0,157 0,301 0,000*** 15 ans et + - 0,575 -Occupation (proportion) Gestion 0,219 0,322 0,000*** Commerce 0,222 0,195 0,266 Fabrication 0,026 0,014 0,153 Santé 0,059 0,032 0,03* Éducation 0,166 0,22 0,01* Administration 0,043 0,28 0,189 Arts 0,034 0,32 0,341 Autres 0,326 0,222 0,000*** Statut (proportion) Personne seule 0,276 0,253 0,36 En couple 0,723 0,746 0,36 Langues (proportion) Anglais 0,0278 0,0673 0,001** Francais 0,258 0,153 0,000*** Bilingue 0,712 0,779 0,008** *** p<0.1%, ** p<1%, * p<5% MA : Diplôme de Maîtrise DI : Diplôme de Médecine Doc : Diplôme de Doctorat

Au vu de tous ces éléments qui créent des soucis dans l’arbitrage entre biais et précision, l’analyse de la robustesse jouera un rôle très important, pour juger de la pertinence de nos résultats.

(31)

Tableau 3.2 – Test de proportion par intervalle (ancien vs nouveau système)

4 ans 8 ans 12 ans

NV ANC NV ANC NV ANC

Scolarité (%) CIB 9,4 14 9,4 16,6 ** 0,2 16,3 ** BAC 62,2 44,8 *** 65,3 42,7 *** 67,7 41,5 *** CSB 6,9 12,7 * 6,9 11,8 ** 5,9 12,6 *** MA 17,1 21,7 14,1 21,2 ** 11,5 21,2 *** DI 1,45 1,8 2,3 1,8 3 1,8 DOC 2,9 4,9 2 5,7 ** 1,5 6,4 M - D 2,14 2,85 1,84 2,87 1,61 2,94 Occupation (%) Gestion 27,6 31,2 24,8 32,71 * 22,1 32,4 *** Commerce 19,63 19 19,5 18,8 21,9 17,7 Fabrication 2,5 0,4 2,7 1,2 2,6 1,3 Santé 2,9 3,16 4,5 3,03 5,9 2,9 Éducation 20,7 22,2 18,4 23,6 16,7 23,6 Administration 2,2 3,2 2,9 2,8 4,3 2,7 Arts 3,3 5,4 3,8 4,5 3,5 4,02 Autres 29,8 22,17 32,54 20,6 32,8 21,45 *** Sans info 1,09 2,71 0,51 2,1 0,98 2,7 * Statut (%) Personne seule 14,91 20 20,44 19,7 27,2 22,5 En couple 85,09 80 79,56 80,3 0,7917 77,5 Langues (%) Anglais 2,9 4,1 2,7 4,5 2,8 6,4 ** Francais 22,5 15,38 23,9 15,4 * 25,8 15,5 *** Bilingue 74,18 80,52 73,23 80,1 * 71 78 * *** p<0.1%, ** p<1%, * p<5%

Puisque par hypothèse, les personnes proches du seuil sont statistiquement semblables dans leurs caractéristiques, nous pouvons admettre que l’effet de traitement devrait demeurer inchangé lors-qu’on intègre des variables de contrôle. La pertinence de ces variables peut se manifester au niveau de la validation du design. Leur présence ne devrait pas fortement influencer le résultat obtenu sans variables de contrôle, mais plutôt augmenter la précision de l’estimateur.

3.2.3 Manipulation du seuil

Comme précédemment mentionné, il est important de porter une attention particulière au com-portement des individus autour du seuil, car en cela réside la validité des hypothèses. Lorsqu’on estime l’effet d’un traitement par la RD design, il faut s’assurer que les individus ne peuvent passer d’un côté à un autre du seuil selon leur volonté. Prenant l’exemple de Van der Klaauw (2002), le

(32)

fait de se trouver dans un groupe où les élèves ont obtenu des scores élevés confère la possibilité d’obtenir une bourse d’un montant plus important, comparativement à si l’on se trouve dans un groupe où les scores étaient plus faibles. Certaines personnes pourraient donc être incitées à forcer la décision et se retrouver dans un groupe supérieur. Si des personnes sont capables de manipuler le seuil, l’hypothèse a peu de chance d’être vérifiée, car les individus autour du seuil ne seraient plus statistiquement comparables. La particularité de la RD design est qu’il est possible de tester s’il y’a manipulation.

Lemieux (2011) propose un test visuel : en considérant le nombre d’observations dans chaque inter-valle lorsque la répartition d’effectifs est faite par rapport à la variable de sélection, si l’on remarque une forte concentration d’observations juste après le seuil, on devrait suspecter un problème de ma-nipulation. Formellement, Lemieux propose en plus de faire une régression de la densité de chaque intervalle sur la variable de sélection de part et d’autre du seuil, et de tester s’il y’a un saut significatif à ce seuil. La littérature montre que certains programmes ou politiques publiques ont tenu compte du problème de manipulation avant l’implémentation. Une méthode pour restreindre le problème est d’annoncer les critères de sélection juste quelques jours ou mois avant la mise en vigueur, de sorte à réduire au minimum l’anticipation des individus et le désir de falsification.

Dans notre étude, ce souci s’avère quasi inexistant. Après la création des Cégeps, l’ancien système fut aboli, et les années d’études pré-universitaires sont passées de quatorze à treize. L’appartenance au groupe de traitement ou au groupe contrôle se fait à partir de la date de naissance, il est donc difficile de manipuler dans l’optique de passer d’un groupe à l’autre.

3.2.4 Limite et avantage

La grande limite de la RD réside dans le fait qu’elle permet d’estimer un effet de traitement local, obtenu à partir des individus proches de la discontinuité. La validité externe de cet effet repose sur une discussion au cas par cas, c’est-à-dire après avoir vérifié la robustesse de l’estimateur. Cependant, la RD démontre toute sa puissance dans la mise en avant de l’effet causal et permet la vérification des hypothèses qui sous-tendent son application. Avec le RD design, la validité interne telle que définie par Brewer (2000) est indubitable, mais pas la validité externe ; d’où les discussions à l’égard de cette méthode.

(33)

Chapitre 4

Résultats

L’objectif de ce mémoire est de mesurer l’effet du changement de système éducatif québécois sur les salaires. Dans ce chapitre, nous présentons les résultats de l’estimation de l’effet du traitement sur obtenus sur les salaire hebdomadaires. Ces résultats sont obtenus à partir de la méthode de RD design, susmentionnée. Par la suite, la robustesse des résultats sera vérifiée par différents tests.

4.1 Effet sur le salaire hebdomadaire (1980)

Le tableau 4.1 présente les résultats d’estimations de l’effet moyen du traitement obtenus à partir de la régression3.4, pour l’intervalle de 4 ans autour du point de discontinuité, et différentes formes fonctionnelles. Les étoiles indiquent le degré de significativité. L’ordre polynomial de la meilleure forme fonctionnelle est obtenu à partir du Critère d’information d’Akaike (AIC). Il est important de s’intéresser à l’ordre polynomial optimal car le fait d’imposer une forme fonctionnelle au modèle constitue un biais (Lee et Lemieux, 2010). Nous nous y intéressons dans notre étude, car la variable d’assignation ne nous permet pas de procéder à des estimations non paramétriques qui permettent de réaliser des tests sur la qualité d’ajustement du modèle. L’analyse descriptive des deux groupes de personnes a montré que pour 4 ans d’intervalle et moins, on a des groupes plus ou moins similaires du point de vue des caractéristiques observables. Cependant, pour des intervalles plus restreints de 3 ans, 2 ans et 1 an, il est impossible d’estimer un effet de traitement. Ce qui justifie l’utilisation de 4 ans comme intervalle de référence.

L’analyse des résultats montre que la suppression d’une année d’étude a un effet significatif sur le salaire au seuil de 0,1%. Cette significativité s’observe pour les formes fonctionnelles linéaire et quadratique. Avec le modèle cubique, aucun effet de traitement n’a pu être estimé compte tenu de l’absence de variation dans les données de l’intervalle de 4 ans pour cette forme fonctionnelle. On remarque que l’effet du traitement est plus élevé pour la forme quadratique, mais il faut noter que

(34)

Tableau 4.1 – RD design : Logarithme du salaire hebdomadaire Intervalle

4ans

Formes fonctionnelles de la RD Design

lineaire 0,18 *** (0,036) quadratique 0,26 *** (0,036) cubic -quartique 0,11 (0,09 )

Ordre polynomial optimal 1

nombre d’observations 493

Note : Écart-type calculé par cluster entre parenthèses *** p<0.1%, ** p<1%, * p<5%

la forme linéaire est celle qui présente mieux la tendance observée dans les données. Les personnes ayant fait le nouveau système ont en moyenne un salaire inférieur à celui des personnes du nouveau système. L’écart est d’environ 18%. C’est donc dire que supprimer une année d’étude a influencé négativement les salaires et ceci de manière significative.

Cependant, il faut souligner que cet effet est juste présent dans les données du recensement de l’année 1981 qui est le recensement le plus proche permettant d’avoir en son sein tous les niveaux d’étude universitaire (voir tableau4.2).

Les données de recensements plus éloignés (1986, 1996 et 2001), ainsi que la fusion de toutes ces bases de données en contrôlant pour l’année de chaque recensement, ne présentent aucun effet de traitement. La variation des formes fonctionnelles également ne change pas ce constat. L’effet observé dans les données du recensement de 1981 semble être un effet de court terme, puisqu’il disparait totalement les années suivantes. Ceci n’est pas surprenant, et peut s’expliquer par l’effet grandissant de l’expérience dans le temps sur le salaire.

(35)

Tableau 4.2 – Résultats de l’estimation du modèle pour d’autres années de recensement Années de recensement

1981 1986 1996 2001 All census

Lineaire 0,18** -0,18 0,15 -0,013 0,028

(0,036) (0,079) (0,25) (0,15) (0,047)

Quadratique 0,26** -0,23 -0,64 -0,55 -0,14

(0,036) (0,042) (0,13) (0,18) (0,0031)

Ordre polynomial optimal 1 1 1 1 1

Nombre d’observations 493 351 244 206 1696

4.2 Robustesse des résultats

Dans cette section, nous présentons les résultats de l’analyse de robustesse de l’effet de traitement estimé à partir des données du recensement de l’année 1981. L’analyse de la robustesse consiste à mettre en exergue le comportement de l’effet de traitement, sous des conditions susceptibles de l’influencer. Ainsi nous montrons comment ce résultat est robuste à : un changement de fenêtres autour du point de discontinuité, l’inclusion de variables explicatives, un changement du seuil, un élargissement du groupe cible.

4.2.1 Élargissement de l’intervalle autour du seuil

Dans la première section du chapitre des résultats, nous avons déjà observé que l’effet de traitement trouvé est robuste au choix de la forme fonctionnelle de l’équation. Il convient maintenant de savoir s’il en est de même lorsqu’on augmente le nombre d’années autour du seuil. Tel que mentionné au chapitre 3, cette pratique est nécessaire dans toute analyse d’effet de traitement présentant une

(36)

discontinuité dans la variable d’assignation5

Tableau 4.3 – Résultats de l’estimation du modèle pour différents intervalles

Intervalles

6 ans 8 ans 10 ans 12 ans

Lineaire 0,14 *** 0,13 ** 0,11 * 0,12 * (0,04) (0,051) (0,05) (0,046) Quadratique 0,25 *** 0,24 *** 0,23 *** 0,18 *** (0,046) (0,039) (0,048) (0,049) Cubic 0,17 * 0,13 0,19 *** 0,26 *** (0,078) (0,09) (0,003) (0,047)

Odre polynomial optimal 1 1 2 2

Nombre d’observations 702 880 1004 1078

Le tableau 4.3 présente les résultats des estimations pour les intervalles de 6 ans, 8 ans, 10 ans et 12 ans pour différentes formes fonctionnelles. Ces résultats sont très significatifs lorsqu’on est encore proche de l’intervalle optimal (4ans), mais décroissent au fur et à mesure qu’on s’en éloigne. Aussi, les résultats sont significatifs pour toutes les formes fonctionnelles prises en compte, malgré le fait que l’ordre polynomial change pour les intervalles plus grands. En somme, on observe que l’effet du

5. En additif à l’élargissement autour du seuil,nous menons une analyse globale sur l’ensemble de l’échantillon afin de vérifier si l’effet de traitement trouvé lors de l’estimation par la méthode RD Design, peut-être extrapolé. Pour ce faire, nous comparons la situation des traités aux non traités par la méthode de double différence. L’observation des résultats montre que l’effet du traitement est positif, très faible. Une année d’étude en plus dans l’intrant éducationnel augmenterait le salaire d’environ 0,9%. Cependant ce coefficient est non significatif au seuil de 5%. Aussi, le coefficient de la variable captant l’effet temporel est positif (0,29) et significatif au seuil de 5%. Cela voudrait dire que le fait d’être né avant 1947 a un impact significatif sur le salaire. Ce qui est totalement normal et peut s’expliquer par l’effet de l’expérience. Cependant, ce résultat pourrait expliquer la non significativité du traitement car l’effet temporel révélé tend à engloutir l’effet de la réforme. Encore une fois, ce problème se pose compte tenu de la difficulté à dissocier le groupe traité du groupe non traité. Nous identifions les individus de chaque groupe à partir de l’âge. Pourtant, l’expérience (croissante dans le temps) est aussi fonction de l’âge. L’analyse sur l’ensemble de l’échantillon se révèle moins précise. Une plus grande variabilité des caractéristiques est intégrée. La différence en différence s’avère peu efficace pour estimer l’effet de la réforme. Néanmoins elle nous permet de conclure que l’effet estimé à partir de la RD design est effectivement un effet local, qui disparaît dans le temps.

(37)

traitement est à la fois robuste à l’élargissement de l’intervalle, et aux différentes formes fonction-nelles de chaque intervalle.

4.2.2 Inclusion de variables explicatives

Une autre pratique commune pour tester la robustesse dans les études empiriques où l’estimation de l’effet de traitement se fait à partir d’une approche de RD design, est : l’inclusion de variables explicatives. Si l’hypothèse d’absence de manipulation du seuil est parfaitement vérifiée, ajouter des variables explicatives n’affectera pas la significativité de l’effet de traitement estimé (Lee et Lemieux, 2010). Puisque l’objectif est d’observer si l’inclusion de ces variables influe sur l’effet de traitement, les coefficients ne sont pas présentés.

Le modèle avec ajout de variables de contrôle est le suivant :

Y = αg+ τ.T + βg.Birth + (βg− βd).T.Birth + ρ.X + µ (4.1)

où X représente le vecteur de variables de contrôle.

Tableau 4.4 – Résultats de l’estimation du modèle avec inclusion de variables explicatives Intervalles

4 ans 6 ans 8 ans 10 ans 12 ans

Formes fonctionnelles de la RD Design Lineaire

Sans variables de contrôle 0,18*** 0,14*** 0,13** 0,11* 0,12*

Avec variables de contrôle 0,16*** 0,12*** 0,11* 0,10* 0,11*

(0,04) (0,04) (0,05) (0,05) (0,06) Quadratique

Sans variables de contrôle 0,26*** 0,25*** 0,24*** 0,23*** 0,18*** Avec variables de contrôle 0,25*** 0,22*** 0,21*** 0,20*** 0,16**

(0,028) (0,048) (0,04) (0,047) (0,051) cubique

Sans variables de contrôle - 0,17* 0,13 0,19*** 0,26***

Avec variables de contrôle - 0,15* 0,09 0,17* 0,24***

(0,08) (0,09) (0,06) (0,05)

Ordre polynomial optimal 1 1 1 2 2

Note : Ecart-type entre parenthèses *** p<0.1%, ** p<1%, * p<5%

(38)

Le tableau 4.4 montre les résultats de l’estimation avec l’ajout de variables explicatives. Comme énoncé plus haut et dans le cadre théorique, ces variables sont : le nombre d’années d’étude, l’expé-rience sur le marché du travail et l’occupation (c’est-à-dire la fonction exercée). La première ligne reporte les résultats des estimations antérieures (estimation sans variable de contrôle). La deuxième présente les résultats du modèle 4.1.

Nous remarquons que l’effet de traitement varie légèrement à la baisse, mais reste toujours positif, significatif pour toutes les formes fonctionnelles et pour la quasi-totalité des intervalles sélectionnés. L’ordre polynomial optimal est resté identique à celui trouvé lors de l’élargissement de l’intervalle. 4.2.3 Changement de seuil

Notre analyse repose sur une hypothèse complexe parce que nous sommes dans l’impossibilité de différencier avec précision les personnes qui ont étudié sous l’ancien système, des personnes qui ont étudié sous le nouveau système. Nous avons donc émis une hypothèse sur le parcours académique : l’âge d’entrée à l’école primaire est de six ans ; le primaire s’effectue en six ans, et débouche sur le cours classique d’une durée de huit années dans l’ancien système. Cependant, aucune loi de cette époque sur la scolarité ne peut nous garantir le bien-fondé de notre hypothèse. De plus, en 1967, année de la création des Cégeps, seulement un petit nombre ont vu le jour, car la transition de système s’est faite progressivement dans le temps.

Outre le problème lié à la mise en place des Cégeps, le trimestre des naissances peut également affecter l’âge des personnes à l’entrée. Le tableau 4.5 ci-dessous, montre le problème énoncé. Les points d’interrogation indiquent l’ambiguïté présente.

Tableau 4.5 – Aperçu de la situation d’ambiguïté autour du seuil

Date d’entrée à l’université sept-64 sept-65 sept-66 sept-67 sept-68 sept-69 sept-70

Année de naissance 1944/1945 1945/1946 ? ? ? 1949/1950 1950/1951

Age a l’entrée 20 20 20 19 19 19 19