• Aucun résultat trouvé

approche par pseudo-panel

1. Revue de littérature

1.1. Approche par pseudo-panel

Pour mener une analyse longitudinale, les données de panel sont souvent utilisées. Cependant, les panels sont rares dans beaucoup de pays, ils coutent cher, et les échantillons comportent en général un nombre limité d’individus et la période couverte est souvent restreinte, ce qui pose un problème pour l’analyse du cycle de vie notamment. De plus, la représentativité d’un panel peut se dégrader au cours du temps en raison de l’attrition (les gens arrêtent de répondre après quelques années) ce qui limite l’analyse de long terme. De plus, les panels sont souvent rotatifs (c’est le cas dans Parc Auto), c’est-à-dire qu’un même individu est interviewé seulement quelques années avant de sortir du panel. Il est donc difficile de suivre un même individu sur une longue période de temps.

C’est pourquoi utiliser les données de pseudo-panel peut être une bonne alternative, et c’est la démarche employée dans ce chapitre.

L’approche par pseudo-panel est une méthode économétrique relativement récente introduite en 1985 par Angus Deaton (Prix Nobel d’économie en 2015). Cette méthode permet une analyse longitudinale sans avoir besoin de vraies données de panel. Il propose d’appliquer une méthode se rapprochant de celles utilisées pour les données de panel mais avec des données transversales indépendantes et répétées dans le temps. L’avantage est que ces données sont souvent disponibles, ce qui facilite l’analyse de sur longue période.

160

Le principe des pseudo-panels est de regrouper les individus ou les ménages au sein de groupes appelés cohortes (ou cellules) fondés sur des critères invariants18 dans le temps comme l’année de naissance ou le sexe. Les cohortes sont construites en calculant la moyenne pour chaque variable d’intérêt à partir des valeurs prises pour les individus présents dans chaque cohorte. Contrairement aux données de panel qui suivent les mêmes individus au cours du temps, ici on suit des cohortes d’individus dont la composition change au cours du temps mais dont les différents individus partagent des caractéristiques fixes et communes dans le temps. Chaque cohorte peut finalement être assimilé à un « individu » et suivi au cours du temps pour former une base de données dite de pseudo-panels.

Quelques précautions doivent être prises pour créer des données de pseudo-panel. D’abord, nous ne connaissons pas la vraie moyenne dans chaque cohorte, qui correspondrait à la moyenne calculée sur l’ensemble de la population appartenant à la cohorte. Dans chaque enquête, il n’y a qu’un certain nombre d’individus appartenant à chaque cohorte qui sont interviewés. Nous n’avons donc qu’une approximation de la moyenne de la population, ce qui peut être sujet à des erreurs de mesure avec des intervalles de confiance qui dépendent de la taille de la population présente dans chaque cohorte et de son homogénéité. Cependant, les moyennes empiriques calculées convergent vers les vraies valeurs, donc il est important d’avoir un nombre suffisamment large d’observations dans chaque cohorte afin d’éviter un biais d’estimation. Verbeek et Niemann (1992, 1993) ont montré que le biais est faible à partir de 100 observations dans chaque cohorte. C’est pourquoi beaucoup d’études empiriques négligent les erreurs de mesures en retour de tailles de cohortes suffisamment larges. Ce sera notre approche dans cette recherche.

De plus, il faut faire attention à l’homogénéité des cohortes. Pour réduire les erreurs de mesure, on augmente le nombre d’observations dans les cohortes mais cela se fait au détriment de l’homogénéité de celles-ci. Ainsi, il faut arbitrer entre biais et variance parce que la précision d’un estimateur croît avec la taille de l’échantillon mais diminue avec sa variance. L’objectif est donc de minimiser la variabilité intra-cohorte et augmenter la variabilité inter-cohorte tout en ayant un nombre suffisant d’observations dans chaque cohorte.

Alors que la majorité des applications empiriques de pseudo-panels définissent les cohortes selon l’année de naissance, certains travaux mixent plusieurs variables. Weis et Axhausen (2009) ont créé des cohortes en regroupant l’année de naissance, le sexe et la localisation des ménages. Bernard et al. (2011) utilisent la localisation des ménages et la taille des habitations pour étudier la consommation d’électricité des ménages. Calvet et Marical (2011) ont construit plusieurs cohortes en regroupant

18

En pratique, on trouve parfois des pseudo-panels construits à partir de critères non stables, comme celui de mixer des variables invariantes et des variables évoluant au cours du temps (année de naissance et localisation du ménage par exemple). Calvet et Marical (2011) ont aussi construit un pseudo-panel par âge. L’âge n’est bien sûr pas un critère stable dans le temps mais ils ont fait ce choix pour suivre des ménages qui ne vieillissent pas dans le temps.

161

l’année de naissance avec le diplôme et l’année de naissance avec le statut socio-professionnel. Cependant, les ménages peuvent changer de localisation résidentielle au cours de leur cycle de vie et les individus peuvent aussi changer de statut socio-professionnel (notamment le passage de la vie active à la retraite), ce qui fait que le choix des critères pour former les cohortes est assez limité. Finalement, un problème d’hétéroscédasticité peut être présent dans les pseudo-panels. En effet, le nombre d’observations entre les cohortes peut être très différent ainsi que pour une même cohorte au cours du temps (car on n’observe pas les mêmes individus). Cela peut être contrôlé par une pondération spécifique.

Gardes et al. (2005) ont créé un pseudo-panel à partir de données de panel et montrent que les estimations avec pseudo-panel sont souvent proches de celles faites avec les données de panel. Si l’on souhaite plus de détails sur la méthode des pseudo-panels, on peut notamment se référer à Guillerm (2017).

1.2. Les pseudo-panels dans le domaine des transports

Plusieurs travaux utilisent les données de pseudo-panel dans le domaine des transports et la majorité de ces applications empiriques s’intéressent à l’automobile. Madre (1990) présente un modèle âge-cohorte-période en liaison avec des prévisions démographiques pour modéliser des projections de tendance de la motorisation et de l’usage. Dargay et Vythoulkas (1999) présente une première application des pseudo-panels avec un modèle économétrique dynamique (modèle à ajustement partiel dynamique). Ils utilisent les enquêtes sur les dépenses des familles au Royaume-Uni pour étudier la relation entre la motorisation et ses déterminants (revenu, coût d’achat et d’utilisation du véhicule, coût des transports en commun, caractéristiques sociodémographiques). Dargay (2002) s’intéresse aussi aux déterminants de la motorisation des ménages en comparant zones rurales et zones urbaines. En utilisant les mêmes données, elle montre que la motorisation est bien moins sensible aux coûts d’achat et d’usage pour les ménages vivant en zones rurales que pour leurs homologues urbains. Dargay (2001) emploie aussi un modèle dynamique en ajoutant de l’asymétrie dans la relation entre motorisation et évolution du revenu. Cette étude montre que l’élasticité au revenu est plus importante avec une hausse du revenu qu’avec une baisse, il y a donc un ajustement moins important face à la baisse du revenu qu’à la hausse (effet cliquet). On voit donc qu’une fois motorisé, il est plus difficile de se démotoriser. Cette étude montre aussi que l’élasticité revenu n’est pas constante et décline avec une hausse de la motorisation. Enfin, Dargay (2007) utilise le même type de modélisation pour analyser la demande de déplacements automobile.

Huang (2007) applique des modèles linéaires et de choix discrets pour générer des prévisions de motorisation en Grande Bretagne. Il combine en particulier les pseudo-panels avec un modèle d’utilité aléatoire (random utility pseudo panel models (RUPPM)). Weis et Axhausen (2009) utilisent les Enquêtes Nationales Déplacements suisses pour créer des données de pseudo-panel et estimer les

162

déplacements induits (demande additionnelle générée par l’amélioration des conditions de déplacements) avec un modèle à équations structurelles. Ils montrent en particulier l’importance des coûts généralisés dans la mobilité automobile. Calvet et Marical (2011) travaillent sur la relation entre prix et consommation de carburant des ménages. Les Enquêtes Budget des Familles de l’INSEE sont utilisées pour former des pseudo-panels entre 1985 et 2006. Ils trouvent que l’élasticité-prix à long terme de la consommation de carburant est comprise entre -0,6 et -0,7. Une différenciation entre le niveau des revenus et les zones de résidence est aussi mise en évidence. Enfin, on peut mentionner l’étude de Tsai et Muller (2014) qui appliquent un modèle dynamique d’ajustement partiel pour analyser les déterminants de la demande de transports en commun ainsi qu’estimer des élasticités de court terme et de long terme.

Les études empiriques sont encore peu nombreuses dans le champ des transports mais elles montrent que les pseudo-panels peuvent être utilisés avec différentes approches de modélisation, comme les modèles statiques ou dynamiques, les modèles de choix discrets, et les modèles à équations structurelles. Pour plus de détails sur la littérature sur les pseudo-panels dans les transports, voir Tsai et al. (2014).