La construction d’un modèle : les choix structurants

1 La microsimulation dynamique appliquée au système de retraite : problématiques générales

1.3 La construction d’un modèle : les choix structurants

Dans la sous-partie précédente, nous avons décrit les grandes étapes de modélisation que l’on retrouve, en théorie, dans l’ensemble des modèles de microsimulation des retraites. Dans cette sous-partie nous nous intéressons aux grands choix structurants susceptibles d’orienter ou de contraindre la modélisation.

Les différents modèles de microsimulation des retraites n’ont pas tous les mêmes objectifs. On peut s’intéresser à l’évolution de l’ensemble de la population d’intérêt au cours du temps, ou s’intéresser au devenir de certaines générations dont on suit l’évolution sur le cycle de vie (modèle de période ou de cohorte). On peut vouloir étudier l’évolution de l’ensemble du système de retraite, ou d’une partie seulement, par exemple les affiliés à un régime de retraite spécifique (modèle régime ou en population générale).

Les différents processus – démographie, carrière, retraite – peuvent être modélisés avec plus ou moins de finesse, selon la complexité des comportements envisagés. Ces choix dé- pendent en premier lieu des priorités du modélisateur, mais aussi des ressources disponibles pour mener des études et calibrer la modélisation des comportements. Pour chaque processus intégré au modèle, il y a arbitrage coût-avantage à faire, pour déterminer le degré de complexité que l’on souhaite donner à sa modélisation. La traduction des objectifs initiaux en choix pratiques de modélisation est également en partie contrainte par la structure du modèle. Ainsi le pas temporel dans la boucle principale doit également être l’échelle adop- tée pour modéliser la dynamique d’évolution de la population. Le choix d’un modèle ouvert ou fermé détermine également les possibilités du modèle, en termes d’interactions entre les individus de la population.

Enfin, une fois arrêtés les objectifs du modèle et les choix de modélisation, la mise en œuvre du modèle nécessite de faire des choix quant à sa structure globale, portant principa- lement sur l’articulation entre les différents modules du modèle et le langage de programmation adopté.

Modèle de période ou de cohorte

La forme générale d’un modèle de microsimulation dynamique correspond à une double boucle imbriquée, parcourant la période couverte par le modèle et les différents individus de la base. La dimension temporelle peut correspondre à une date t, la microsimulation génère alors des photographies successives de la population de la date de début à la date de la fin de simulation. On parle alors de modèle de période. Dans un modèle de cohorte, c’est l’âge

a que l’on parcourt pour les individus d’une ou plusieurs cohortes. Il apparait donc qu’un

modèle de période, simulant l’évolution de la population à un horizon suffisamment lointain pour reconstituer les trajectoires complètes, englobe un modèle de cohorte. C’est d’ailleurs 170

CHAPITRE4- LA MICROSIMULATION: PRINCIPES ET USAGES

l’approche adoptée dans le chapitre 5 de cette thèse, qui évalue à l’aide d’un modèle par période le partage du cycle de vie entre travail et retraite pour les générations successives.

Mais les perspectives des deux approches sont différentes. Dans un modèle de période, l’accent est mis sur l’évolution au cours du temps d’agrégats clés d’un système de retraite, comme la masse des pensions dans le PIB ou le niveau relatif des pensions, comme illustré au chapitre 6 qui étudie les effets agrégés de réformes structurelles. D’autres types de ré- sultats peuvent être obtenus : la microsimulation génère, pour chaque date considérée, une photographie de la population, qui peut donner lieu aux mêmes exploitations statistiques que des données observées classiques. Dans un modèle de cohorte (ou un modèle de pé- riode utilisé comme un modèle de cohorte), on s’intéresse à l’analyse de la redistribution sur le cycle de vie au sein d’une génération donnée, ou entre certaines générations si on en simule plusieurs. La perspective est donc d’analyser les effets redistributifs du système de retraite, ou de ses éventuelles réformes.

La base initiale : modèle régime ou en population générale ?

Dans le domaine de la microsimulation du système de retraite, la question du modèle ouvert ou fermé rejoint directement celle de l’opposition entre des modèles dits « tous régimes », ou en population générale, qui ont pour base une population représentative de l’ensemble de la société, et des modèles « régimes », spécifiques à certaines populations d’assurés. Un modèle régime se concentre sur les individus affiliés à un régime de retraite spécifique, ce qui en général induit de se limiter à cette population d’intérêt et à ne pas modéliser les individus qui ne sont jamais affiliés au régime.

Il est en théorie possible d’avoir un modèle régime en population générale, qui considère en priorité les passages dans le régime mais sur la base d’une population représentative. Ce- pendant, sauf pour les régimes couvrant une grande proportion de la population, une telle démarche est très coûteuse en termes de taille d’échantillon et donc de vitesse d’exécution, car cela implique de conserver un nombre important d’individus qui ne servent pas directement pour les résultats du modèle.

Modèle ouvert ou fermé

Même si l’analyse des interactions entre individus n’est pas l’application principale d’un mo- dèle de microsimulation du système de retraite, certains processus simulés peuvent mettre en jeu des liens entre individus, comme la mise en couple et les naissances. La question se pose alors de savoir si ces liens sont modélisés entre individus présents dans le modèle. Ainsi, une naissance donnera lieu à la création d’un nouvel individu dans la base, et une union se fera entre deux individus présents dans la base. On parle alors de modèle fermé. L’autre solu- tion est de créer des individus fictifs rattachés à la population du modèle (enfant, conjoint), 171

PARTIEII : L’ÉVALUATION PAR MICROSIMULATION

éventuellement avec certaines caractéristiques si elles sont pertinentes pour la simulation, mais qui ne sont pas directement des individus identifiés dans la population. On parle dans ce cas d’un modèle ouvert.

Un modèle fermé a l’avantage de respecter la structure de la population, et d’offrir des perspectives de modélisation plus riches intégrant une dimension « ménage » (taxation, com- portement de départ en retraite), mais impose une contrainte forte sur les poids des individus dans la population. Un modèle ouvert présente moins de contraintes de simulation, mais il est plus difficile de reproduire la structure agrégée de la population car l’on mélange des individus effectivement dans la population et des individus additionnels qui leur sont liés, sans que la cohérence entre les deux types d’individus soit assurée.

Notons qu’il y a un lien entre le choix d’un modèle ouvert ou fermé et d’un modèle régime ou en population générale. Un modèle régime oriente de fait vers un modèle ouvert : les unions ne peuvent se former uniquement entre individus d’un seul régime, et tout enfant qui nait ne deviendra pas un affilié au régime.

Le pas temporel

Au autre question importante dans la traduction opérationnelle de la modélisation des processus concerne le pas temporel, c’est-à-dire de la durée écoulée entre deux dates successives dans la boucle temporelle. Le choix du pas temporel est déterminé par trois éléments principaux : l’échelle pertinente pour décrire les processus étudiés, la durée d’exécution de la simulation et la disponibilité des données infra-annuelles.

Un pas temporel plus fin (trimestriel, voire mensuel) permet de modéliser des transitions plus précises, correspondant mieux à ce que l’on observe en réalité. Si les phénomènes dé- mographiques ne semblent pas justifier un pas infra-annuel, cela semble en revanche plus pertinent pour les transitions sur le marché du travail, ou les choix de départ en retraite. Sur ce dernier point, les réformes du système de retraite prévoyant des modifications au mois près (pour le relèvement des bornes d’âge notamment) rendent quasiment indispensable une modélisation infra-annuelle des départs en retraite. Mais l’utilisation d’un pas temporel infra-annuel peut significativement alourdir un modèle de microsimulation, aussi bien au niveau de la modélisation que du temps d’exécution. En outre, modéliser des processus infra-annuels implique de pouvoir estimer des modèles sur des données de ce type. En gé- néral, les données longitudinales utilisées pour l’estimation des transitions d’emploi ou de retraite sont annuelles5_{et ne permettent donc pas une modélisation à un pas plus fin, sauf à}

faire des hypothèses sur la répartition des durées annuelles entre les mois ou des trimestres. En pratique, il est tout à fait envisageable d’avoir différents pas temporels pour les dif-

5_{Des données infra-annuelles, avec des information de date-à-date sur les séquences d’emploi, sont toute-} fois de plus en plus souvent disponibles.

CHAPITRE4- LA MICROSIMULATION: PRINCIPES ET USAGES

férents types de processus à modéliser ; c’est d’ailleurs ce qui est fait dans les modèles exis- tants, comme souligné dans la section suivante de ce chapitre, recensant les choix adoptés en pratique par les modélisateurs.

Articulation entre les modules : approche séquentielle ou intégrée ?

La structure la plus intuitive pour un modèle de microsimulation est une double boucle im- briquée par date et par individu : à chaque date, pour tous les individus, l’ensemble des va- riables présentes dans le modèle évolue, selon un processus déterminé par le modélisateur. Mais, par souci de rapidité d’exécution des simulations, certains processus peuvent être trai- tés de manière séparée. Ainsi par exemple dans le modèle Destinie (cf. infra), les trajectoires individuelles – naissances et unions d’une part et trajectoires professionnelles d’autre part – sont modélisées en amont de la simulation du départ en retraite. Cette approche « par blocs » est moins coûteuse en temps, car certains processus qui ne varient pas d’une simulation à l’autre n’ont pas besoin d’être re-simulés à chaque fois.

Mais cette approche suppose qu’il n’y a pas d’effets rétro-actifs d’un module sur un autre module simulé en amont. Si l’on simule les processus séparément dans l’ordre union-carrière- retraite, la carrière ne peut avoir un impact sur la probabilité d’union, de même que la retraite sur la probabilité d’être en emploi avant la retraite.

Choix du langage de programmation

Enfin, un dernier choix structurant concerne le langage de programmation du modèle. Dif- férentes options sont possibles : un langage de programmation généraliste (C++, Fortran, Perl, Python), un langage statistique (SAS, Stata, R), ou des plateformes dédiées intégrant des routines optimisées (Liam2, Modgen).

L’avantage des langages généralistes est la rapidité d’exécution de la simulation, et la grande flexibilité que permet ce type de langage. La contrepartie est la possible difficulté d’accès pour les modélisateurs, qui ne sont pas toujours des programmeurs purs.

De l’autre côté du spectre, les langages statistiques sont mieux connus des modélisateurs- types, et permettent en outre de réaliser sur un même support les différentes étapes du mo- dèle que sont la calibration, la simulation et la production des sorties. La contrepartie est cette fois la vitesse d’exécution, globalement plus lente par rapport aux langages de programmation.

Enfin, le développement récent de plateformes dédiées à la construction de modèles de microsimulation, avec des routines optimisées, par exemple de tirage ou de calage, permet de réduire fortement l’investissement initial pour la construction d’un nouveau mo- dèle. Reste la possibilité d’une spécificité du modèle qui n’est pas intégrable facilement dans le cadre de la plateforme, illustrant la principale limite de cette option : une moins grande 173

PARTIEII : L’ÉVALUATION PAR MICROSIMULATION

flexibilité et une autonomie moindre par rapport aux autres langages. La multiplication des modèles utilisant ces plateformes suggère toutefois que les plateformes sont suffisamment flexibles pour les besoins des modélisateurs, flexibilité qui est d’ailleurs amenée à s’accroitre à mesure qu’une communauté d’utilisateurs développe et améliore la plateforme.

Dans le document Équilibrer le système de retraite : quelles réformes pour quels objectifs ? (Page 183-187)