• Aucun résultat trouvé

Le Long File longitudinal de l éducation

N/A
N/A
Protected

Academic year: 2022

Partager "Le Long File longitudinal de l éducation"

Copied!
13
0
0

Texte intégral

(1)

Division Population et formation

Team LABB, édition octobre 2019

Le Long File longitudinal de l’éducation

Méthodologie de construction et documentation

des variables

(2)

Le Long File longitudinal de l’éducation

Table des matières

1 Introduction ... 3

2 Statistiques de base ... 3

2.1 Sources de données sur la formation ... 4

2.2 Sources de données sociodémographiques... 5

3 Construction du Long File ... 5

3.1 L’identifiant individuel ... 5

3.2 Etat des nomenclatures ... 6

3.3 Types d’enregistrements ... 7

3.4 Structure du Long file ... 7

4 Description des variables ... 8

5 Traitement des enregistrements avec des dates imprécises ... 11

5.1 Le dernier enregistrement de l’année ... 11

6 Traitement des cas particuliers ... 12

6.1 Trajectoires « à priori » atypiques ... 12

6.2 Trajectoires incomplètes ... 12

7 Concept de diffusion des LongFile ... 12

8 Conclusions ... 13

(3)

1 Introduction

Le numéro AVS à 13 chiffres (NAVS13) introduit comme identifiant individuel dans les registres de l’administration fédérale, suite à la Loi sur l’Harmonisation des Registres du 23 juin 2006, élargit considérablement le potentiel d’analyse selon deux axes d’exploitation : intégration de différents relevés (appariement transversal) permettant d’élargir l’information disponible sur l’unité d’analyse et intégration de différentes années du même registre (appariement longitudinal). Ce dernier axe ouvre ainsi de nouvelles voies pour l’analyse longitudinale dans les statistiques officielles. Dans le cadre du projet « Analyses longitudinales dans le domaine de la formation » (LABB), l’OFS construit, à partir des relevés dans le domaine de la formation (SdL, SBA, SBG et SIUS), des fichiers longitudinaux pour l’étude des flux dans le système de formation, qui seront complètement régénérés lors de chaque actualisation.

Par le biais de d’un identifiant individuel, le contenu des fichiers longitudinaux est enrichi avec des informations provenant d’autres registres ou enquêtes. Cela permet de définir la population de référence des quatre statistiques de base (SdL, SBA, SBG et SIUS)1 et de connaître de façon plus précise le profil sociodémographique de l’élève.

D’une manière générale, au préalable de toute analyse de données, un référentiel commun est nécessaire. Dans le cadre du programme d’analyses longitudinales dans le domaine de la formation, c’est le Long File longitudinal de la formation qui constitue ce référentiel commun.

Ce document présente la méthodologie de construction et les variables présentes dans le Long File harmonisée de la formation.

2 Statistiques de base

Le Long File longitudinal de la formation regroupe les différents registres statistiques de la formation de l’OFS (SdL, SBA, SBG et SIUS) qui ont été harmonisées et couplées de façon à permettre un suivi de l’élève au cours du temps. Il contient également des informations sociodémographiques qui sont tirées de la STATPOP et du Relevé Structurel (RS).

1 Les statistiques de formation utilisées dans la construction du Long File recensent tout élève/diplôme/étudiant enregistré dans le système de formation suisse. L’appariement avec les statistiques de la population permet de savoir si les élèves enregistrés font partie de la population résidente permanente ou non.

(4)

Le Long File longitudinal de l’éducation

2.1 Sources de données sur la formation

SdL :

La statistique suisse des élèves et des étudiants résulte de 26 statistiques cantonales. Sont recensées toutes les personnes qui suivent pendant au moins une demi-année un programme visant un objectif de formation déterminé, à plein temps ou à temps partiel. Le relevé s'étend du degré primaire 1-2 (école enfantine/cycle élémentaire années 1-2) au degré tertiaire (hautes écoles non comprises) et inclut les institutions de formation publiques et privées. Les données provenant des 26 cantons sont harmonisées au niveau suisse. La statistique est compatible avec la Classification internationale type de l'éducation (CITE) de l'UNESCO.

SBA :

La statistique des diplômes dénombre chaque année les certificats des écoles de formation générale au niveau secondaire II, ainsi que les brevets, les diplômes et les diplômes postgrades du degré tertiaire (formation professionnelle supérieure).

SBG

La statistique de la formation professionnelle initiale (SFPI) se base sur les registres cantonaux des apprentis. Ces registres contiennent entre autres des informations sur les personnes inscrites dans une formation professionnelle initiale (la formation mentionnée dans le contrat d'apprentissage) et sont complétés par les résultats à la procédure de qualification (examen de fin d'apprentissage). La statistique existe depuis l'entrée en vigueur de la Loi sur la formation professionnelle (1934) et est sous la responsabilité de l'OFS depuis 1984. Pour la construction du Long File, ont été retenus uniquement les enregistrements relatifs aux procédures de qualification, échec ou titres réussi.

(5)

SIUS

La banque de données des étudiants et diplômes du système d'information universitaire suisse (SIUS) a été conçue au début des années 1970 pour répondre aux besoins croissants de coordination et de planification de la Confédération et des cantons dans le domaine des hautes écoles. Elle renseigne sur la situation dans les études, le déroulement de celles-ci et sur le profil sociodémographique des étudiants. Toute personne immatriculée dans une haute école possède un identifiant personnel. Celui-ci permet de traiter les données personnelles relevées de manière anonyme et de réaliser des analyses de flux (par ex. changements de haute école ou de branche, taux de réussite, durée des études). Depuis l'année scolaire 2012/13, le NAVS13 est relevé en complément pour chaque personne, ce qui permet d’effectuer des analyses longitudinales sur l'ensemble des niveaux de formation.

2.2 Sources de données sociodémographiques

STATPOP :

La Statistique de la population et des ménages fait partie du système de recensement annuel de la population. Elle livre des informations concernant l’effectif et la structure de la population résidente à la fin d’une année ainsi que des mouvements de la population pendant l’année en cours.

Relevé structurel

Le relevé structurel est un élément du recensement fédéral de la population, qui complète les informations des registres avec des statistiques sur la structure de la population. Il est réalisé auprès d’un échantillon de la population de plus de 200'000 individus.

3 Construction du Long File

Les quatre sources de données sur la formation ont été couplées dans un fichier commun où chaque ligne correspond à un enregistrement de la formation et où pour chaque identifiant le fichier contient plusieurs lignes. Ainsi, ce fichier permet de suivre le parcours de l’élève.

Les statistiques SdL, SBA et SBG disposent d’un identifiant individuel depuis 2011. Ainsi, pour ces sources les séries historiques dans le Long file débutent en 2011. En ce qui concerne le SIUS, la série historique commence en 1980, étant donné que le numéro de matricule est disponible depuis les années 1980, ce qui permet un suivi longitudinal des étudiants des Hautes Écoles beaucoup plus long.

3.1 L’identifiant individuel

Une base de données longitudinale nécessite la définition d’un identifiant individuel permettant de suivre l’unité d’observation dans le temps. Le NAVS13-pseudonymisé représente l’identifiant individuel unique disponible dans les sources de données.

Dans la mesure où il arrive que cet identifiant individuel change au cours des années, la procédure suivante a été mise en place pour identifier et traiter ces cas problématiques. La définition de l’identifiant individuel utilisé dans LABB passe par 2 étapes :

1. Mutation éventuelle puis « validation »

2. Assignation d’un nouvel identifiant pour les enregistrements pour lesquels l’identifiant est jugé non valide ou n’a pas été livré.

Plausibilisation des NAVS13 :

(6)

Le Long File longitudinal de l’éducation

Pour la plausibilisation de l’identifiant individuel, un registre de base, contenant les NAVS13- pseudonymisé de STATPOP/ UPI (avec des NAVS13 mis à jour à une date de référence donnée), est utilisé comme référence.

Deux règles sont suivies pour la plausibilisation de ces identifiants :

1. Les identifiants provenant des relevés de la formation sont tout d’abord actualisés si nécessaire sur la base des informations disponibles dans les registres de la Centrale de Compensation (CdC). Ce registre renseigne sur les cas de « mutation » ou

« d’interruption » de NAVS132. En cas de mutation3 du NAVS13, l’identifiant est actualisé de sorte à assurer la continuité du suivi de la personne concernée. Si l’identifiant est indiqué comme étant interrompu, la personne concernée est considérée par la suite du traitement comme n’ayant pas de NAVS13 (NotNAVS13) sur la variable Lernidcat. Un identifiant personnel stable est cependant créé et conservé pour la période avant interruption.

2. Il est possible que l’identifiant fourni dans les statistiques de la formation soit valide mais se réfère à une autre personne. Par exemple, pour un élève de l’école obligatoire, le NAVS13 d’un des parents pourrait avoir été livré à l’institution formatrice au lieu de celui de l’élève. Afin d’éliminer des problèmes de ce type, des contrôles sur l’âge sont introduits. Au cas où l’âge indiqué dans la STATPOP est différent de celui indiqué dans les statistiques de la formation et où cet âge n’est pas plausible pour le degré considéré sur la base des critères retenus dans les statistiques de la formation4, alors nous faisons l’hypothèse qu’il ne s’agit probablement pas de la même personne. Dans ce cas, le NAVS13 indiqué n’est pas compatible avec des analyses longitudinales, il est donc considéré comme non-valide (NotNAVS13).

NAVS13 manquant :

1. Un certain nombre d’enregistrements de la SDL, SBG et SBA, principalement en 2011, n’avaient pas d’identifiant NAVS13 stable. Pour ces personnes, une analyse longitudinale n’est pas possible. Les enregistrements de ces personnes sont cependant conservés dans les fichiers : un numéro unique à travers les sources et le temps leur a été affecté afin de les traiter en conséquence dans les différents fichiers.

En 2011, les enregistrements sans NAVS13 pour le degré secondaire II s’élevaient à 8% des élèves et à 24% des titres. La proportion de NAVS13 manquants s’est considérablement réduite en 2012 : elle n’est que 2,22% pour les élèves et 0,77% pour les diplômes. En 2017 seulement 0.3% des enregistrements concernant les élèves et 0.1% de ceux concernant les titres avaient n’avaient aucun NAV13 valide.

2. Dans le SIUS, pour les cas où le NAVS13 était manquant, le numéro matricule a été utilisé (LernidCat= « MAT »). Le numéro matricule, disponible depuis 40 ans dans le SIUS, permet d’analyser les parcours des étudiants avec une plus grande ampleur.

L’utilisation de ce matricule à la place du NAVS13 manquant, réduit toutefois les possibilités de couplages et limite les analyses sur les flux.

3.2 Etat des nomenclatures

Les variables du fichier sont toujours recodées selon la nomenclature la plus récente lors de la publication des données. Par exemple les nomenclatures spatiales pour l’édition 2017 présentent l’état des communes au 31-12-2016. Il en est de même pour les nomenclatures sur

2 Un numéro AVS peut être muté quand, suite à un divorce, la situation familiale de l’enfant change, alors il est possible que la CdC lui assigne un nouveau NAVS13. Un Numéro AVS est interrompu quand il y a un départ définitif de Suisse.

3 Les données de la CdC nous informent si le numéro doit être muté ou est interrompu. Dans le premier cas, toutes les sources sont mutées à une même date de référence (p.ex. 31.12.2014).

4 Par exemple, pour le degré secondaire II, l’âge retenu plausible est compris dans la fourchette 14-65 ans.

(7)

la formation.

3.3 Types d’enregistrements

Le Long file harmonisé de la formation présente deux types d’enregistrements (cf. variable e_eventType) :

1. Enregistrement de type élève/étudiant qui indique l’inscription de l’élève à une formation qui rentre dans le périmètre d’analyse de la SdL ou du SIUS (voir définitions ci-dessus) ;

2. Enregistrement de type « diplôme » s’il y a la présence d’un titre (réussite de l’examen) ou une inscription à la procédure de qualification (qu’il soit réussite ou échec à l’examen). La variable e_eventType distingue ces deux types d’enregistrements (élève ou diplôme). Pour les enregistrements de la variable e_eventType qui marquent un événement diplôme, la variable e_gradecompletion dit si le titre a été obtenu ou non.

Les informations sur les échecs aux titres sont disponibles seulement pour le degré secondaire II (puisque relevés seulement dans les statistiques SBA et SBG). Pour les Hautes écoles, chaque événement « diplôme » est automatiquement un titre obtenu.

3.4 Structure du Long file

Dans le fichier en format Long file, chaque individu présente systématiquement un enregistrement par année s’il s’agit d’un enregistrement de type « élève »5. Concernant les enregistrements de type « diplôme », il peut il y en avoir plusieurs durant la même année en cas de présentation plusieurs fois durant la même année à la procédure de qualification, ou en cas d’obtention de deux titres (par exemple un CFC et une Maturité professionnelle). D’une manière générale, la structure du fichier est la suivante :

1. Ecole obligatoire : un enregistrement élève par année.

2. Formations post-obligatoires :

a. pour les enregistrements « élève » : un seul enregistrement par année.

b. pour les enregistrements « diplôme » : plusieurs enregistrements possibles par année.

La Figure 1 fournit une illustration, à travers un exemple fictif, de la structure des données telle qu’elle existe dans le Long File.

Figure 1: exemple d’une trajectoire de formation fictive suivant la structure du Long File.

5 Dans un nombre de cas très restreint, il peut il y avoir deux enregistrements par élève la même année (par exemple, une personne inscrite dans une école supérieure et dans un cours préparatoire au Brevet Fédéral).

Dans ce cas un algorithme de priorisation a été élaboré. La variable dformFlag indique l’enregistrement retenu en cas de présence de doubles formations la même année (voir le point 5.1 pour plus de détails).

(8)

Le Long File longitudinal de l’éducation

4 Description des variables

Dans le fichier le préfixe des variables serve à indiquer son contenu et la statistique d’origine.

1. Les variables avec le préfixe e_* proviennent des statistiques de la formation et généralement représentent le contenu d’une information de type éducatif (SdL, SBA, SBG ou SIUS);

2. Les variables avec le préfixe sp_* indiquent des variables provenant de la STATPOP et contiennent des informations de type démographique

3. Les variables avec le préfixe se_* se réfèrent aux informations provenant du Relevé Structurel.

Dans la construction du Long File, comme résultat de l’appariement de différents registres, les informations de STATPOP ont été privilégiées. Dans ce cas, si une variable est présente dans STATPOP mais aussi dans les relevés de la formation, l’information de STATOP a été retenue.

Si l’élève n’avait pas un numéro AVS valide – et que donc l’information n’était pas présente dans STATPOP – l’information a été prise des registres de la formation en privilégiant l’information de la SdL.

Variables démographiques

Vn L’identifiant individuel pseudonymisé. La pseudonymisation est effectuée chaque année de production statistique. Tout comme le NAVS13, il s’agit d’un code à 13 chiffres dont les deux premiers désignent l’année de la pseudonymisation, et les chiffres suivants un numéro croissant. A cause de cela il n’est pas possible lier éditions différentes du Long File

Sex Le sexe de la personne. Cette information provient de la STATPOP pour les enregistrements avec NAVS13 et des relevés de la formation pour ceux qui n’ont pas de NAVS13.

Populationtype Le statut de l’élève dans les registres de la population Suisse (1 : Population résidente permanente ; 2 : Pas dans la population résidente permanente ; 3 : Pas dans STATPOP).

Dateofbirth Date de naissance (selon la STATPOP pour les élèves avec NAVS13, selon les relevés de la formation pour les élèves qui n’ont pas de NAVS13) [Variable interne non diffusée].

Yearofbirth Année de naissance (selon la STATPOP pour les élèves avec NAVS13, selon les relevés de la formation pour les élèves qui n’ont pas de NAVS13).

Stateofbirth Pays de naissance de l’élève (selon la STATPOP). Utilise la nomenclature des états et territoires de l’OFS.

Nationalitystate Nationalité de l’élève, (selon la STATPOP pour les élèves avec NAVS13, selon les relevés de la formation pour les élèves qui n’ont pas de NAVS13). La classification suit la nomenclature des états et territoires de l’OFS.

Ageofcharrival Âge d’arrivée en Suisse (selon la STATPOP). La variable indique l’âge de la dernière arrivée en Suisse. Donc si une personne a eu plusieurs départs et arrivés en Suisse seulement la dernière est indiquée.

Inpopchuntil La variable indique le prochain départ des registres de la population pour l’enregistrement considérée si on sélectionne les personnes qui sont dans les registres de la population (Populationtype = 1) cette variable utilisée conjointement avec Populationtype permet de contrôler pour les départs de Suisse dans une certaine période de temps.

Statmig1 Statut migratoire (combinaison de la nationalité et du pays de

(9)

naissance)

Variables sur la commune de domicile (variables tirées de la STATPOP) Sp_municipofresidence La commune de résidence de l’élève

Sp_cantonofresidence Le canton de résidence de l’élève

Urbanrural Le type de commune de l’élève (urbaine vs rurale)

Languageregion La région linguistique de la commune de résidence de l’élève

Variables d’origine sociale (variables tirées du RS)

Se_highestleveledupa Niveau de formation le plus élevé du ménage (agrégé)6 Se_highestleveledupa2 Niveau de formation le plus élevé du ménage (détaillée) Se_crhouseholdid Variable identifiant le ménage

Se_hhpersweight Pondération du ménage

Se_zone Variable de stratification pour la zone

Variables sur la structure du Long File

(variables indiquant les sources et le type d’identifiant)

Lernidcat Trois types d’identifiant possibles : NAVS13, MAT (numéro de matricule) ou NotAVS (identifiant de type cantonal ou autre)

Source Source d’origine de l’enregistrement issue de la statistique de la formation : SdL, SBA, SBG ou SIUS

Sourcedemo Statistique d’où proviennent les informations démographiques de l’élève (STATPOP, SPE ou une des quatre statistiques de la formation) Counter Il s’agit d’un compteur unique d’enregistrement, c’est-à-dire pour

chaque ligne du Long File. Le compteur a 13 chiffres, les quatre premiers indiquent l’année de l’enregistrement, la cinquième et sixième indiquent le relevé d’origine de l’enregistrement et enfin les restantes chiffres représentent un compteur interne au relevé.

Variables sur la formation de l’élève

E_eventtype Type d’enregistrement (Elève ou Diplôme)

E_date Date de l’enregistrement. Les dates sont renseignées au jour près uniquement pour les dates des examens des formations générales et de la formation professionnelle supérieure. Pour les enregistrements des élèves les dates ont été imputées :

- au 15-08-YYYY pour les enregistrements provenant de la SdL (école obligatoire, degré secondaire II et tertiaire sauf les hautes écoles) - au 15-09-YYYY (au 15-10-YYYY avant 2012) pour les enregistrements du SIUS (inscriptions aux hautes écoles)

- au 30-06-YYYY pour les enregistrements de type « Diplôme » de la FPI (dont la source est le relevé SBG).

E_impdate Indique si la date de l’enregistrement (e_date) a été imputée ou non.

E_year Année de l’enregistrement

E_firstlanguage Première langue de l’élève (seulement pour les enregistrements tirée de la SdL)

E_cantonbeforestudies Canton de résidence avant le début du parcours dans une Haute Ecole (variable relevée uniquement dans le SIUS)

E_municipbeforestudies Commune de résidence avant le début du parcours dans une Haute Ecole (variable relevée uniquement dans le SIUS)

E_statebeforestudies Etat de résidence avant le début du parcours dans une Haute Ecole (variable relevée uniquement dans le SIUS et reconstruite pour les

6 Les élèves indiquées comme « Pas en position enfant dans le ménage » représentent des élèves habitant dans des ménages collectifs.

(10)

Le Long File longitudinal de l’éducation

Écoles Supérieures)

E_educprog Type de formation détaillée suivie par l’élève (relevé uniquement dans les enregistrements de SdL, SBG et SBA). Pour les Hautes Écoles, la variable équivalente est : e_shisFields3

E_cantoneducprog Formation suivie au niveau le plus détaillé. Pour les enregistrements de l’école obligatoire, la classification suit la nomenclature du canton de l’institution. Pour les enregistrements de la formation professionnelle initiale, la classification donne la formation ainsi que l’option spécifique de la formation choisie. Pour ceux des formations générales le contenu de la variable est le même que E_educprog.

E_educyear Année de programme de la formation (relevé uniquement pour les enregistrements de la SdL).

E_gradecompletion Variable qui indique le résultat de la procédure de qualification (relevé uniquement dans les enregistrements de SBG ou SBA).

E_formtype Modalité de l’enseignement (à temps plein, formation duale école/entreprise ou à temps partiel)

E_bfeld1 Grands domaines CITE (selon classification CITE 2013) E_bfeld2 Domaines détaillées CITE (selon classification CITE 2013) E_bfeld3 Domaines spécifiques CITE (selon classification CITE 2013)

E_timeoff Congé (interruption des études accordé par l’université, l’étudiant reste immatriculé)

E_shisfields3 Type de formation suivie par l’élève (relevé uniquement pour les enregistrements SIUS).

E_levelofStudy Niveau d’étude (relevé uniquement dans le SIUS)

E_educlength Durée formelle minimale de la formation. Relevée uniquement dans les enregistrements de la Formation Professionnelle Initiale

E_eductype1 Type de formation selon nomenclature LABB niveau 1 E_eductype2 Type de formation selon nomenclature LABB niveau 2 E_eductype3 Type de formation selon nomenclature LABB niveau 3 E_yearbaccalaureate Année de la maturité (relevé uniquement dans le SIUS) E_admissionqualification Certificat à l’entrée d’une Haute Ecole

E_schoolbaccalaureate Ecole de l’obtention du certificat d’accès à la Haute Ecole (relevée uniquement dans le SIUS)

E_municipofInst Commune de l’institution de formation E_cantonofInst Canton de l’institution de formation E_schooltype Type d’école (public/privé)

E_instType Type d’institution (HEU, HES, HEP, FPS)

E_institution Nom de l’institution relevée uniquement dans les Hautes Ecoles (p. ex.

Université de Lausanne) E_institutiondet Ecole membre des HES

E_institutionmeb Identificateur de l’institution de formation E_deliverycanton Canton livreur des données

Previedtype_meb La formation précédente (relevée uniquement dans la SdL), à utiliser seulement comme variable de contrôle ou pour corriger la censure à gauche pour les données des élèves de 2011.

Tfevent Indique le dernier évènement de l’année (voir point 5.2.)

Dformflag Indique le doublon potentiel en présence de deux enregistrements élève la même année (voir point 5.1.)

E_classid Identificateur unique de la classe

E_vm1training Participation à une formation de type MP1 (maturité professionnelle pendant l’apprentissage)

(11)

5 Traitement des enregistrements avec des dates imprécises

Dans les statistiques de la formation, on dispose d’information détaillée au jour près uniquement pour les titres du degré secondaire II. Etablir un ordre chronologique des enregistrements durant la même année est donc assez difficile. Pour aider à faire des choix de priorisation d’événement, deux variables ont été ajoutées au Long File : la variable DformFlag et la variable TFevent qui sont présentées ci-dessous Doubles enregistrements de type « élève »

Pour le degré secondaire II et l’école obligatoire, il est possible que certains enregistrements soient présents à double durant la même année de programme. Afin de choisir un seul enregistrement, l’algorithme de priorisation des événements suivant a été élaboré :

1. Si l’un des deux enregistrements est à temps plein et le deuxième à temps partiel, alors c’est celui à temps plein qui est retenu ;

2. Si le canton livreur d’un des deux enregistrements est le même que celui de la commune de résidence de l’élève, alors celui-ci est retenu ;

3. Si l’un des deux enregistrements concerne un établissement spécialisé, alors c’est celui-ci qui est retenu ;

4. Si aucune de ces conditions n’est remplie (par exemple deux enregistrements à temps plein), alors un tirage aléatoire est effectué.

Le résultat de cet algorithme est indiqué dans la variable DformFlag. Elle distingue notamment entre :

1) Enregistrement élève présent à double et à éliminer des analyses 2) Enregistrement élève présent à double et à utiliser dans les analyses 3) Enregistrement élève unique

Une deuxième sélection sur les enregistrements de type élève est ensuite effectuée en considérant l’ensemble des enregistrements retenus dans le degré secondaire II et ceux du degré tertiaire. Lorsqu’un élève possède deux enregistrements pour une même année, on ne retient que l’enregistrement du degré le plus haut hiérarchiquement (étudiant des hautes écoles > étudiant de la formation professionnelle supérieure > élève du degré secondaire II).

5.1 Le dernier enregistrement de l’année

Pour certaines analyses (par exemple, l’étude de l’entrée dans une formation, du premier diplôme etc.) il est important de connaître le dernier événement de l’année. Cette information est renseignée dans la variable Tfevent.

Néanmoins – dans les statistiques de la formation, la date précise est connue uniquement pour les enregistrements de type diplôme du degré secondaire II (maturités gymnasiales, spécialisées et professionnelles et les titres des écoles de culture générale) et de la formation professionnelle supérieure. C’est pourquoi, pour déterminer le dernier enregistrement durant la même année en présence de dates non-connues, les arbitrages suivants ont été effectués : 1. Dans le cas où deux enregistrements de type élève sont présents, c’est la variable

dformFlag qui identifie directement l’enregistrement à choisir.

2. Dans le cas d’un enregistrement diplôme et d’un enregistrement élève, c’est l’enregistrement le plus récent qui est choisi (cela même si la date de l’enregistrement élève est imputée, en faisant l’hypothèse que l’inscription à une nouvelle formation se fait après l’obtention d’un titre).

3. Dans le cas de deux titres obtenus la même année et où pour au moins un des deux enregistrements la date n’est pas connue, le diplôme le plus élevé est retenu. Si les deux diplômes sont du même niveau alors un tirage aléatoire est réalisé.

(12)

Le Long File longitudinal de l’éducation

6 Traitement des cas particuliers

Comme le Long File de la formation est le résultat de différentes statistiques indépendantes il est possible que l’appariement donne lieu à des trajectoires qui peuvent sembler atypiques.

Cela peut être causé par des particularités liées à la couverture d’un relevé, des problèmes potentiels de livraisons durant une année déterminée ou encore des logiques de fonctionnement interne d’une institution. Ce paragraphe traite de ces cas.

6.1 Trajectoires « à priori » atypiques

La variable e_educLength indique la durée minimale de la formation pour les élèves de la formation professionnelle initiale. Comme il s’agit de la durée minimale, il est possible que des élèves inscrits à une formation dont la durée minimale est de 3 ans soient en 4ème année de programme. C’est par exemple le cas d’un certain nombre d’apprentis dans l’industrie de l’horlogerie dans le canton de Neuchâtel.

6.2 Trajectoires incomplètes

Formations non relevées dans la SdL

Pour le degré secondaire II, la statistique principale sur laquelle se base le Long File est la SdL. Dans cette statistique sont recensés tous les épisodes de formation dont la durée est d’au moins six mois et ayant une finalité bien précise (préparation en vue de l’obtention d’un titre). C’est pourquoi, les élèves effectuant un stage ne sont pas présents dans le relevé, dans la mesure où les stages sont hors du périmètre de la SdL. Dans le même ordre d’idée, les cours préparatoires aux examens fédéraux (Brevet et Maîtrise) d’une durée inférieure à six mois n’entrent pas dans le périmètre de la SdL. Ces lacunes peuvent ainsi « invisibiliser » certaines trajectoires de formation, ce qui peut mener à des interprétations biaisées (par exemple : rupture de formation) qui ne reflètent pas la réalité.

Pour les élèves du degré secondaire II, il est possible de surmonter ces limites grâce à la partie de la statistique SBG (formation professionnelle initiale) qui relève les contrats d’apprentissage. La SBG renseigne en effet sur l’existence de contrats d’apprentissage qui ne sont pas relevés par la SdL et qui correspondent temporellement aux « ruptures » identifiées dans le parcours de formation et dont la profession correspond à celle renseignée dans la SdL.

Ces cas ont été ajoutés au Long File sous la forme d’épisodes de formation et sont indiqués comme « Enregistrement imputé SBG » dans la variable « Source ».

Problèmes de livraison de données

Dans quelques cas très sporadiques il y a eu des problèmes dans la livraison de données lors d’une année en particulier. Ceci peut provoquer des trous dans la séquence observée.

Passages du Bachelor au Master sans obtention de titre Bachelor

On observe – dans un nombre de cas limité – des passages du Bachelor au Master sans obtention de titre de Bachelor. Dans ces cas, des titres de Bachelor ont été imputés dans le Long File. Ceux-ci apparaissent comme « Enregistrements imputés SIUS » dans la variable source.

7 Concept de diffusion des Long File

Les Long Files distribués au public sont des extractions de données provenant du Long File harmonisé de la formation. A présent dans le programme LABB quatre types de Long files

(13)

sont disponibles :

1) Les Long Files des transitions charnières du système de formation. Font partie de cette catégorie de Long Files, les fichiers qui traitent de la transition après la fin de l’école obligatoire et ceux qui traitent de la transition après un titre du degré

secondaire II

2) Les Long Files concernant un degré particulier du système de formation comme le degré secondaire II ou le degré tertiaire. Ces fichiers sont construits sur la base de l’extraction des enregistrements concernant un degré donné.

A côté de cela le programme LABB offre deux autres types de Long Files :

3) Les Long Files mixtes. Ces fichiers regroupent deux Long Files, comme le Long File de la transition après l’école obligatoire et celui des parcours dans le degré

secondaire II. Ces fichiers sont utiles pour répondre à des questions concernant le parcours de l’élève sur une plus longue période (p. ex. de la fin de l’école obligatoire au premier titre du degré secondaire II).

4) Long Files basés sur des événements. Le programme LABB, extrait les événements principaux du système de formation (p. ex. le dernier évènement de l’école

obligatoire). Si par exemple le chercheur est intéressé à la trajectoire entre la fin de l’école obligatoire et l’entrée dans une formation passerelle, il est possible de générer un Long File contenant les enregistrements entre ces deux évènements.

Le Long File par degré

Le Long File par degré se basent sur une extraction de tous les enregistrements d’un degré déterminé. Ainsi le Long File du degré secondaire II comprend tous les enregistrements du degré secondaire II.

Ces fichiers permettent d’analyser des transitions particulières telles que le passage d’un premier titre du degré secondaire II à un deuxième titre du même degré (par exemple combien d’élèves continuent vers un autre CFC en 3 ans après un premier CFC ou bien après avoir obtenu un titre d’une ECG.

A présent les degrés couverts par le programme LABB sont

1. Le Long File du degré secondaire II : comprenant tous les enregistrements dans ce degré à partir de 2011.

2. Le Long File du degré tertiaire : comprenant les enregistrements dans le degré tertiaire à partir de 2011 pour les HE et les ES et de 1980 pour les HE.

Le Long File des transitions charnière :

A présent ils existent deux Long Files des transitions charnière : 1. Le Long File de la transition à la fin de l’école obligatoire

2. Le Long File de la transition après l’obtention d’un titre du degré secondaire II.

8 Conclusions

Le fichier longitudinal de l’éducation en format long harmonisé est la première base de données en Suisse à donner des informations de façon exhaustive et détaillées sur le parcours scolaire des élèves et étudiants. Elle est le résultat de l’harmonisation et du couplage de six registres et enquêtes statistiques dont le but est de reconstruire et contextualiser les cheminements dans le système de formation en Suisse.

Références

Documents relatifs

Ce cinquième colloque sera l’occasion de confronter les points de vue en matière de formation et de professionnalisation des enseignants dans les disciplines

À partir des expériences acquises dans les formations professionnelles d’électroplaste CFC et d’assis- tant en traitement de surface AFP, le contrôle doit servir à mettre en

éditer les données brutes pour la production de médias et les préparer pour l’utilisation adaptée aux médias,c. créer des graphiques pour la production

PELLANDA DIECI, Sandra Bettina, WEISS, Laura, MONNIER-SILVA, Anne Catherine.. PELLANDA DIECI, Sandra Bettina, WEISS, Laura, MONNIER-SILVA,

Interdisciplinarité en formation initiale et professionnalisation des enseignants du secondaire.. MONNIER-SILVA, Anne Catherine,

Genève : Université de Genève, Faculté de psychologie et des sciences de l'éducation, 2008, 335 p.

Avec le Profil interactionnel du stagiaire (PIS), questionnaire issu du champ du climat social de la classe, le stagiaire peut prendre connais- sance des divergences entre ses

TPSOU2 3 leçons en atelier équipé pour soudage, dont 1 leçon en salle d'instruction TPPEI2 3 leçons en atelier de peinture, dont 1 leçon en salle d'instruction TPTOL3 6 leçons