• Aucun résultat trouvé

Application du modèle logit mixte emboîté dans le cadre de l'estimation de la demande de transport

N/A
N/A
Protected

Academic year: 2021

Partager "Application du modèle logit mixte emboîté dans le cadre de l'estimation de la demande de transport"

Copied!
87
0
0

Texte intégral

(1)

APPLICATION DU MODELE LOGIT MIXTE

EMBOÎTÉ DANS LE CADRE DE L'ESTIMATION

DE LA DEMANDE DE TRANSPORT

Mémoire présenté

à la Faculté des études supérieures de l'Université Laval dans le cadre du programme de maîtrise en économique

pour l'obtention du grade de maître es arts (M.A.)

DÉPARTEMENT D'ECONOMIQUE FACULTÉ DES ÉTUDES SUPÉRIEURES

UNIVERSITÉ LAVAL QUÉBEC

2006

(2)

L'objectif de ce mémoire est d'appliquer la méthodologie du modèle logit mixte dans le cadre de l'estimation de la demande de transport. L'idée de base est de remplacer le modèle logit emboîté, construit par l'équipe de chercheurs de University of Toronto, par un modèle beaucoup plus flexible qui est le logit mixte à erreurs composées. Avant de procéder à l'estimation, un exercice d'identification plutôt complexe doit être effectué étant donnée la structure riche de la matrice des covariances. Le modèle est calibré avec les données provenant du sondage sur les habitudes de déplacements de la grande région de Toronto : Transportation Tomorow Survey (TTS). Les résultats affichent un bon comportement et le modèle est capable de capter une partie de la corrélation recherchée par la structure des facteurs. Le modèle logit mixte emboîté performe mieux que le modèle logit standard au niveau de la vraisemblance maximisée et de la prévision des probabilités de choix.

(3)

Avant-propos

Avant de poursuivre, je tiens à souligner le support de plusieurs personnes qui ont contribué à la réalisation de ce mémoire ainsi qu'à tout mon succès académique.

Premièrement, je tiens à remercier mon directeur de recherche, M. Denis Bolduc, pour son support financier pendant mes études de maîtrise, mais surtout pour sa compréhension, son côté humain et sa présence lorsque des questions sans réponse, aux yeux d'un jeune étudiant-chercheur, se sont présentées au cours de la réalisation de ce projet.

Ensuite, j'aimerais souligner la disponibilité et la générosité du groupe de recherche du Département de génie civil de l'Université de Toronto, et notamment du professeur M. Eric John Miller, qui nous ont fourni les données et de nombreuses explications.

Finalement, je remercie mes parents pour leur support moral, leurs encouragements et leurs conseils. Si j'écris ce paragraphe aujourd'hui, c'est en bonne partie grâce à eux.

(4)
(5)

Table des matières

RÉSUMÉ I

AVANT-PROPOS II TABLE DES MATIÈRES IV LISTE DES TABLEAUX VI LISTE DES FIGURES VII

CHAPITRE 1 : INTRODUCTION 1

1.1 CONTEXTE ENVIRONNEMENTAL 1 1.2 PLAN DE MÉMOIRE 5

CHAPITRE 2 : SIMULATION URBAINE ET PROJET ILUTE 6

2.1 LES MODÈLES DE SIMULATION URBAINE 6 2.2 LEMODÈLE ILUTE 7 2.3 MODULETASHA 12

CHAPITRE 3 : LES MODÈLES À CHOIX DISCRETS 17

3.1 FONDEMENTS THÉORIQUES DES MODÈLES À CHOIX DISCRETS 17 3.2 LOGIT POLYTOMIQUE 19

3.2.1 Variations de goût 23 3.2.2 Substitution proportionnelle entre les alternatives 24 3.2.3 Méthodes d'estimation 27 3.2.4 Effets marginaux et élasticités. 29

3.3 LES MODÈLES DU TYPE GEV 31

3.3.1 Tendances de substitution 32 3.3.2 Probabilités de choix 34 3.3.3 Décomposition en deux logits 36 3.3.4 Estimation 38

3.4 LOGIT MIXTE 39

3.4.1 Probabilités de choix. 40 3.4.2 Tendances de substitution 41 3.4.3 Approximation de n'importe quel MUA 42 3.4.4 Simulation et estimation 43 3.4.5 Logit mixte à erreurs composées 44 3.4.5.1 Logit mixte emboîté 46 3.4.5.2 Identification du logit mixte à erreurs composées 48 CHAPITRE 4 : PARTIE EMPIRIQUE 53 4 . 1 R E V U E DE LITTÉRATURE 5 3

4.2 D O N N É E S 55 4.3 M O D È L E H O M E - T O - W O R K MODE CHOICE 59 4 . 4 L E M O D È L E 6 0

CHAPITRE 5 : RÉSULTATS D'ESTIMATION 65

5.1 PRÉSENTATION ET INTERPRÉTATION DES RÉSULTATS 65

5.1.1 Valeurs du temps 70

5.2 COMPARAISON DE LA PERFORMANCE 72

CHAPITRE 6 : CONCLUSION 75 BIBLIOGRAPHIE 77

(6)

Liste des tableaux

Tableau 3.1 : Exemple de réactions des probabilités de choix suite à l'exclusion des alternatives de l'ensemble de choix

Tableau 3.2 : Caractéristiques du logit mixte et des modèles GEV

Tableau 4.1 : Résumé des principales caractéristiques du sondage TTS-1996 Tableau 4.2 : Modes de transport choisis dans l'ensemble de choix

Tableau 4.3 : Liste de variables explicatives

Tableau 5.1 : Résultats d'estimation selon le modèle et les types d'emploi Tableau 5.2 : Valeurs du temps ($CAN, 1996)

Tableau 5.3 : Comparaison de la performance des deux modèles Tableau 5.4 : Résultats des tests de significativité de la matrice T

(7)

Liste des figures

Figure 2.1 : Le cadre d'analyse du modèle ILUTE

Figure 2.2 : Exemple d'un voyage généré dans le modèle TASHA Figure 2.3 : Exemple du processus de décision d'un ménage

Figure 3.1 : Relation entre la probabilité de choix et l'utilité représentative Figure 3.2 : Exemple d'un arbre de choix en deux niveaux

(8)

INTRODUCTION

1.1 Contexte environnemental

La question de la qualité environnementale ainsi que la problématique tant connue du développement durable font partie des discours économique et politique de tous les jours. L'une des grandes inquiétudes environnementales est le réchauffement climatique causé par l'émission des gaz à effet de serre (GES). C'est le point principal de tous les efforts considérés dans le protocole de Kyoto, c'est-à-dire, diminuer l'émission des GES pour ainsi ralentir le réchauffement de la planète qui menace de causer de graves changements climatiques. Alors, l'augmentation de la température moyenne sur la surface terrestre devrait faire fondre les grands glaciers dans les deux pôles haussant ensuite le niveau de la mer et menaçant ainsi tous les pays côtiers. On prévoit aussi une plus grande fréquence des phénomènes naturels extrêmes (ouragans, tornades, inondations, etc.) dans tous les coins de la planète. Bref, c'est la vie de l'homme sur la Terre qui est mise en question et non pas la survit de la planète qui va continuer à tourner et s'adapter à ces changements. Bien sûr, cela ne se produira pas dans un proche avenir, c'est un processus très lent du point de vue de la vie humaine, mais c'est un processus difficilement contrôlable. Il est alors évident que la question des changements climatiques est directement responsable du développement durable de l'humanité dans les siècles à venir.

La science économique s'est penchée sur cette problématique et elle a identifié la cause du problème : les externalités. Par définition, les externalités sont les conséquences, positives ou négatives, d'une action de production ou de consommation d'un agent affectant l'utilité d'un autre agent sans que ces effets soient traduits par l'un des mécanismes du marché (en général les prix). Dans le cas des changements climatiques, les externalités sont nombreuses. Même nous, lorsqu'on respire, on encourage le réchauffement de l'atmosphère en expirant du CO2. De manière plus sérieuse, toute notre activité cause l'émission des GES. Bien sûr, il y a des actions plus dangereuses que d'autres, comme les centrales

(9)

activités personnelles comme les choix de chauffage et de transport qui sont aussi importantes que les premières. Cependant, elles sont plus difficiles à contrôler étant donnée leur caractère totalement décentralisé.

En théorie, on sait régler le problème d'externalité. La science économique a trouvé des solutions qui passent par les moyens incitatifs (taxation), les réglementations (normes environnementales) ou par l'attribution des droits de propriété sur la ressource concernée. Il s'agit simplement de corriger cette imperfection du marché en incluant les coûts environnementaux et sociaux dans le processus de production ou de décision des agents économiques. La solution n'est malheureusement pas aussi évidente dans la vraie vie et surtout dans le cadre des changements climatiques et l'émission des GES.

L'option des droits de propriété est inapplicable car l'air appartient à tout le monde. C'est l'exemple typique d'un bien public dont tout le monde profite mais que personne ne possède exclusivement. De plus, le réchauffement n'est pas un processus statique et isolé. Une voiture à Québec émet des GES et affecte ainsi la vie d'un Aborigène en Australie via la propagation de ces gaz dans l'atmosphère. Comment alors donner le droit de propriété à cet Aborigène lui procurant la possibilité de poursuivre le québécois qui laisse son « pick-up » se réchauffer pendant 20 minutes au mois de janvier? Cet exemple caricatural est parfaitement applicable au niveau beaucoup plus agrégé. Comment un pays pauvre comme l'Ethiopie peut poursuivre les Etats-Unis pour avoir émis 25% de la quantité totale des GES pouvant ainsi contribuer aux sécheresses encore plus prononcées et meurtrières dans ce pays africain? Les exemples ne manquent pas pour conclure que cette option est difficilement applicable, voir utopique.

La solution réglementaire est déjà présente depuis qu'on a commencé à se soucier des effets causés par nos activités sur l'environnement. Nous avons imposé des normes environnementales à des industries polluantes. Bien sûr, il s'agit souvent d'un moyen vicieux de protectionnisme, mais dans ce cas il crée une externalité positive pour l'environnement. Cependant, il est souvent très difficile de trouver les normes optimales considérants les coûts et bénéfices marginaux de leur imposition. Elles ralentissent le développement économique, causent des mises à pieds, relocalisent des industries, etc. De

(10)

environnemental de ces mesures.

La taxation est peut-être le moyen le plus apprécié chez les économistes surtout pour son côté incitatif qui fait corriger les imperfections du marché et qui influence les décisions des individus. Cependant, comme dans le cas des normes, il faut bien connaître les fonctions des coûts marginaux social et privé ainsi que la fonction des bénéfices marginaux pour pouvoir appliquer une taxe optimale. En pratique, cela est impossible à cause de l'asymétrie de l'information (une entreprise privée polluante ne donne pas toute l'information pertinente) ou simplement par la difficulté physique d'estimer les coûts marginaux. Alors, comment appliquer la taxation pour solutionner le problème des changements climatiques causés par l'émission des GES ? Il faut taxer la source de ces émissions, donc l'activité industrielle, les secteurs résidentiel et commercial ainsi que les transports. Le gouvernement canadien encourage le changement du comportement des agents économiques vis-à-vis l'environnement en appliquant des taxes sur les branches d'industries très polluantes mais aussi en offrants des incitatifs fiscaux à ceux qui améliorent la consommation d'énergie.

Le quatrième type d'intervention est la sensibilisation de la population à la question environnementale. L'exemple du projet Suroît au Québec peut témoigner que les gens sont maintenant plus conscients des enjeux environnementaux et s'impliquent à la cause. Bien sûr, le problème du « free rider » est le frein principal dans cette mesure. Nous pouvons voir présentement des campagnes de sensibilisation voulant influencer les gens à moins utiliser leurs voitures, à faire du covoiturage, à ne pas laisser réchauffer l'auto, à mieux consommer l'énergie, etc. Il est évident que de nombreux individus ne changeront pas les habitudes en se disant que d'autres vont le faire. Mais malgré le problème de resquillage et le manque d'incitatif tangible, ce type d'intervention a sa place car une société bien informée de la problématique risque de se mieux comporter face aux mesures réglementaires et incitatives. À titre d'exemple, nous savons à quel point c'est important pour la Banque du Canada d'être transparente et crédible dans ses politiques pour garder le taux d'inflation cible dans la fourchette voulue. Il est aussi essentiel pour l'Office de l'efficacité énergétique d'informer les individus sur le problème des changements

(11)

mesures appliquées donnent des résultats escomptés.

Dans cet univers d'études et d'accords environnementaux, un chapitre est réservé aux milieux urbains perçus comme des grandes sources de pollution et surtout des plus grands émetteurs de gaz à effet de serre. Dans les grandes agglomérations les plus importants pollueurs sont les zones industrielles mais aussi les véhicules. Pour les premiers, différentes solutions ont déjà été appliquées comme la taxation, l'établissement des normes environnementales et même la relocalisation. Mais le grand problème reste au niveau des transports. D'après les études de l'Office de l'efficacité énergétique,

on attribue au secteur des transports 34% des émissions de GES soit plus que tout autre secteur. Cela découle du fait que les sources d'énergie utilisées dans les transports, principalement l'essence et le carburant diesel, émettent plus de GES que toute autre source d'énergie lors de la combustion1.

Il est alors évident que le respect de l'engagement canadien dans le protocole de Kyoto passe par la diminution des émissions de GES dans le secteur des transports. Pour ce qui est du transport commercial, on offre des crédits d'impôt aux entreprises qui achètent des camions moins énergivores, on peut réglementer la circulation des poids lourds et ainsi faire baisser leur consommation de carburant, etc. Cependant, il est très difficile de faire diminuer l'usage des automobiles à combustion dans les grandes villes étant donnés les distances à parcourir, le confort et la flexibilité que procure la possession d'une voiture ainsi que le coût d'utilisation relativement bas. Les gens ont le choix d'utiliser le transport en commun ou leurs voitures pour les déplacements ainsi que la fréquence de ces derniers. Le problème des émissions de GES à partir de l'usage des automobiles est particulièrement important en Amérique du Nord étant donné les grandes distances entre les villes mais aussi la bonne infrastructure routière dans les milieux urbains. La ville de Québec occupe le premier rang canadien au niveau de kilomètres d'autoroute par habitant : deux fois plus que la moyenne nord-américaine qui est de 10 kilomètres par 100 000 habitants2. C'est une ville

avec un territoire très grand et une densité de population relativement basse. Il est alors

1 Rapport 2003 de l'Office de l'efficacité énergétique Canada

2 Hulbert, François (1994). Essai de géopolitique urbaine et régionale. La comédie urbaine de Québec. 2e

(12)

d'essence est historiquement très bas en Amérique du Nord ce qui a influencé une culture d'avoir les grandes voitures consommatrices importantes de combustible. De plus, nous sommes entourés d'un marketing incroyable de la part des producteurs d'automobiles et de conditions de plus en plus abordables d'achat de voiture que la perte environnementale tombe dans le second plan dans la vie de tous les jours.

1.2 Plan de mémoire

L'objectif de ce mémoire est d'étudier le choix du mode de transport des individus dans une grande ville. Ici, la base de données utilisée provient de la ville de Toronto et le but sera de mesurer la sensibilité du choix modal des individus au niveau des déplacements reliés au travail pour la période type de 6h et 9h du lundi au vendredi.

Après cette introduction de la problématique environnementale de manière très globale, nous verrons dans la prochaine section comment les scientifiques étudient les milieux urbains dans le but de faciliter la tâche du gouvernement dans sa mission de faire baisser la pollution urbaine et ainsi faire diminuer l'émission de GES. L'accent sera mis sur le projet ILUTE (Integrated Land Use, Transportation, Environment) car ce mémoire en fait partie. Nous verrons de plus près comment notre travail s'incorpore dans le cadre d'ILUTE et quels sont ses objectifs. Dans le chapitre 3, nous expliquerons plus en profondeur l'approche méthodologique. L'application empirique sera présentée dans le chapitre 4 tandis que les résultats obtenus suivront dans le chapitre 5.

(13)

SIMULATION URBAINE ET PROJET ILUTE

2.1 Les modèles de simulation urbaine

Avant de passer à l'analyse du modèle ILUTE, nous préférons mentionner quelques caractéristiques de la classe générale de modèles à laquelle appartient notre sujet d'intérêt. Nous avons vu que la qualité environnementale est très affectée par la pollution urbaine. Trois quarts de monoxyde de carbone causant l'effet de serre proviennent des véhicules motorisés. Ce problème s'aggrave dans le temps dû à la migration de la population vers les milieux urbains et à une augmentation du parc automobile dans les villes. Cette croissance du nombre d'utilisateurs des routes n'est pas toujours suivie par le développement de l'infrastructure ce qui a comme résultat une croissance constante du trafic et donc une croissance de consommation d'essence et d'émission des gaz à effet de serre. Imaginons seulement l'augmentation du nombre d'automobiles en Chine et en Inde pendant leur boom économique. Pour répondre à ces changements, les planificateurs urbains doivent connaître les demandes pour le transport, l'espace industriel et l'espace résidentiel. Il est important de tenir compte des interactions entre ces différents secteurs du milieu urbain. Les modèles permettant la structure interdépendante sont les modèles intégrés de transport et d'utilisation des sols (MITUS). Miller et al. (1998) présentent les principales caractéristiques de ce type de modèles ainsi qu'une grande revue de littérature permettant au lecteur intéressé d'en apprendre davantage.

Un autre aspect primordial du modèle ILUTE est la microsimulation. L'approche de modélisation par la microsimulation gagne en importance depuis plusieurs années et elle profite des avancements dans la technologie informatique. Elle permet de générer les inputs détaillés qui sont indispensables dans les modèles MITUS désagrégés. Le lecteur intéressé par la microsimulation est invité à consulter Miller (1996). Le papier de Goulias et Kitamura (1992) donne également un exemple intéressant de l'approche par la microsimulation dans la prévision de la demande du transport.

(14)

Le modèle ILUTE (Integrated Land Use, Transportation, Environment) est construit à University of Toronto par M. Miller et M. Salvini du département de génie civil. De plus, une équipe de chercheurs de cinq universités canadiennes (University of Toronto, Université Laval, University of Calgary, McMaster University et Wilfrid Laurier University) participent simultanément à ce projet3.

ILUTE est un modèle compréhensif de micro simulation des systèmes urbains. Sa raison d'être est de remplacer les modèles conventionnels aidant le choix des politiques urbaines et des politiques de transport et surtout de mesurer les effets à court et à long terme de ces dernières sur l'environnement. Miller et Salvini (2001) donnent les objectifs de ce projet qui est encore dans l'étape du prototype :

1. Développer un laboratoire informatisé dans lequel seront étudiés les processus spatiaux urbains.

2. Atteindre une meilleure compréhension de l'évolution et du comportement spatial du milieu urbain.

3. Tester l'approche par la microsimulation dans les modèles compréhensifs des grands systèmes urbains.

4. Développer les modèles améliorés et opérationnels d'utilisation des sols et des systèmes de transport pouvant aider les politiques urbaines.

Ces objectifs sont atteints avec le développement du modèle ILUTE comme une coquille vide et très flexible. La raison pour développer un laboratoire plutôt qu'un simple modèle de demande de transport est de permettre la compétition de différents modules. Il est ainsi facile d'intégrer des composantes et des les tester. En effet, tous les chercheurs peuvent incorporer leurs modèles dans ILUTE, les vérifier et y porter des modifications. De plus, l'équipe de Toronto mettra bientôt au point une librairie de codes de programmes et de modèles en ligne auxquels toutes les équipes de chercheurs auront l'accès.

L'essor de modèles intégrés permettant d'analyser les systèmes de transport a conduit à l'élaboration d'un cadre méthodologique présenté à la figure 2.1 où l'accent est mis sur

! Toute l'information sur le modèle et sur l'équipe de chercheurs se trouve sur le site officiel

(15)

l'interconnexion de plusieurs facteurs déterminant - le choix de localisation résidentielle et industrielle et celui de l'utilisation des sols liés à la planification des transports par les activités et les déplacements des personnes et des biens - le développement durable du milieu urbain ainsi que leur influence sur la qualité environnementale.

Figure 2.1 :

Le cadre d'analyse du modèle ILUTE

Utilisation des sols Développement urbain

î

Utilisation des sols/

împlacements résidentiels et industriels

I

Choix de localisation

E

Activités / Déplacements des personnes et des biens

ivironneme:nt ) Facteurs d'impact C "^ - Démographie - Emploi - Conditions économiques • - Politiques gouvernementales - Politiques de transport

- Politiques visant à améliorer l'environnement V

' Planification des transports

Détermination du nombre de véhicules

i

Génération /distribution des déplacements Choix modal

•ii

Affectation surleréseau

i

Les individus font le choix d'utiliser un type de transport selon leurs activités et leur positionnement en milieu urbain. L'environnement est directement affecté par ces activités. Plusieurs facteurs extérieurs influencent ce processus et ajoutent une dimension dynamique à la prise de décision des agents au niveau du choix de localisation, de transport et de

(16)

différentes politiques gouvernementales). Ainsi, la récente politique proposant de taxer les utilisateurs de véhicules 4x4 vise à influencer le choix du mode de transport et conséquemment à avoir un impact sur l'environnement. Comme la figure 1 le montre, le système ILUTE peut se caractériser par quatre composantes :

1. Développement urbain: cette composante modélise l'environnement urbain incluant le développement des sols vacants et l'évolution des sols déjà occupés. 2. Choix de localisation : cela inclut le choix de localisation des ménages, des firmes

et des travailleurs. Cette composante est liée avec la précédente par le module étudiant l'utilisation des sols et les emplacements résidentiels et industriels.

3. Activité/déplacements : cette composante du modèle implique la prévision du comportement de la population au niveau des déplacements (planification de transport, choix modal, etc.). Elle sera étudiée en profondeur plus loin car elle est le cadre principal du mémoire.

4. Possession de véhicule : ce module détermine le nombre de véhicules dans le ménage ce qui est un facteur important dans la modélisation du comportement en matière de transport.

Il est important de noter que chacune des quatre composantes inclut plusieurs sous modèles. Par exemple, les relations entre les agents sont basées sur l'interaction entre l'offre et la demande de sorte que les prix soient déterminés de manière endogène (les prix des maisons proviennent de l'interaction des agents sur le marché des maisons, le salaire est déterminé aussi par le marché du travail, etc.). La hiérarchie du modèle permet la simulation à court et à long terme. À court terme, certains niveaux demeurent fixes comme le développement urbain. Le choix de localisation est fait avec le stock fixe des espaces résidentiels et industriels. Le choix d'activités et de déplacements est fait avec le choix fixe de destinations et un nombre prédéterminé de véhicules. Dans le cas de simulation à long terme, toutes les composantes évoluent simultanément dans le temps. Finalement, les facteurs d'impacts peuvent être endogènes ou exogènes. Les politiques gouvernementales au niveau du transport et de l'environnement sont traitées comme exogènes tandis que les caractéristiques démographiques et les conditions économiques régionales sont déterminées de façon endogène permettant ainsi une plus grande flexibilité du modèle.

(17)

Avant de regarder la structure de ILUTE de manière plus technique, voyons les critères énoncés par Miller et Salvini (1998) que le modèle doit respecter.

1. Le modèle doit être transférable à d'autres milieux urbains que Toronto. Pour tester cette caractéristique, il sera aussi appliqué à Edmonton et à Québec.

2. Le modèle est complètement basé sur la microsimulation avec les ménages, firmes, etc.

3. Les modèles de déplacement seront utilisés pour générer la demande de transport tout au long d'une journée type de 24 heures.

4. Les modèles de localisation résidentielle et industrielle sont basés sur les interactions des agents sur les marchés ce qui permet la détermination des prix de façon endogène.

5. Les modèles d'affectation des déplacements sur le réseau intègrent les calculs d'émission de polluant et d'utilisation d'énergie.

6. Les données permettant la calibration proviennent d'enquêtes locales (Toronto Tomorow Survey) et des données de sources officielles comme les données de recensement de Statistique Canada. Cela permettra la formation de base de données commune ce qui facilitera la comparaison entre les trois villes.

ILUTE simule les activités des objets individuels (agents) lorsqu'ils évoluent dans le temps. Le simulateur met au point l'état du système urbain à partir d'un mois de base jusqu'au mois final. Les agents dans le modèle sont représentés par les individus divisés en ménages et familles. Il existe évidemment une infrastructure de transport. Plusieurs marchés sont formés dans le modèle : le marché des maisons, le marché du travail ainsi que le marché des biens et services qui sont représenté par les firmes et par les personnes. Finalement, l'économie est représentée par le taux d'intérêt et le taux d'inflation (les deux sont exogènes au modèle).

Présentement, le prototype du modèle contient 15000 lignes de code en C++ dans 50 classes. Ce code supporte :

a) série d'objets (ménages, personnes, emplois et bâtiments,

b) importation des données spatiales : données du recensement, donnée du Transportation Tomorrow Survey (TTS), des réseaux routiers, les données sur les

(18)

temps de trajet provenant du logiciel EMME/2 et des données économiques (taux d'intérêts et indices des prix à la consommation),

c) analyse de l'état du système et du comportement des objets en tout moment,

d) suivi des activités et des comportements des objets dans le système lorsqu'ils évoluent,

e) simulation de l'émigration et de l'immigration,

f) exportation des données dans les bases de données et une visualisation en 3D. Trois sous modèles ont été introduits jusqu'à présent :

1. marché résidentiel, 2. marché d'automobiles, 3. génération d'activités.

Le premier est responsable du marché des maisons dans le modèle et contient des ménages offreurs et demandeurs. ILUTE utilise un processus en trois étapes pour modéliser la mobilité résidentielle : décision de mobilité, processus de recherche et offre. Le modèle du marché des automobiles est développé à partir des travaux théoriques de Mohammadian et Miller (2000). Il utilise les caractéristiques des ménages, des propriétaires, des conducteurs, leurs stocks de véhicules actuels et les attributs de chaque véhicule pour déterminer si le ménage va garder son niveau de véhicules, en acheter, en vendre ou en échanger. Le troisième sous modèle a pour but de générer les activités quotidiennes dans ILUTE.

Ce prototype d'un super modèle de simulation urbaine donne une base solide pour des recherches futures. Voici quelques propositions qui rendront ILUTE un vrai modèle du fonctionnement urbain.

a) Le modèle du marché des maisons sera amélioré de sorte que l'offre suit la demande dans le temps avec l'augmentation de la population. Incorporer l'effet de rareté. b) ILUTE contient présentement les emplois mais il n'y a pas de représentation des

firmes. Il serait donc intéressant d'implanter ces objets.

c) Les prix sont ajustés d'une période à l'autre à l'aide de l'IPC. Mais le mécanisme ne détermine pas les différences relatives des différentes sortes de produits dans le temps. Il faudrait donc avoir des indices de prix à la consommation séparés pour différents types de biens.

(19)

d) Améliorer la stabilité du modèle.

Enfin, le modèle ILUTE servira d'une bonne base au développement et l'amélioration des modèles de microsimulation urbaine. Le point très intéressant avec ce modèle est sa flexibilité. On peut l'appliquer à n'importe quelle ville en autant qu'on possède toutes les données nécessaires pour une simulation réaliste. De plus, le principe de ce modèle peut certainement s'appliquer dans d'autres domaines que le transport, notamment en économie du travail et en macroéconomie.

2.3 Module TASHA

Le mémoire a pour but d'estimer un modèle du choix des modes de transport. Mais l'intérêt principal du groupe de recherche est de pouvoir utiliser ces estimations dans le cadre du modèle de simulation TASHA (Travel/Activity Scheduler for Household Agents). TASHA est une des composantes très importantes de la structure ILUTE car elle a pour responsabilité de générer les activités extérieures des ménages, donc tous les déplacements en dehors des maisons, et ce pour les 24h d'une journée de la semaine. Pour le moment, M. Miller et son équipe ont conçu TASHA seulement pour simuler les déplacements reliés au travail, mais un des étudiants au doctorat, M. Juan Antonio Carrasco, travaille présentement sur la génération des déplacements pour les activités sociales comme aller visiter la famille ou les amis, aller au cinéma, etc. Tous ces déplacements sont générés par un modèle de choix modal basé sur les tours4. Les individus et les ménages sont modélisés dans un cadre

de microsimulation orienté-objet pour être capable de l'incorporer dans ILUTE. Les contraintes du nombre de véhicules dans les ménages sont présentes ainsi que l'information sur les possibilités de covoiturage. Chaque personne est considérée rationnelle et elle base sa décision sur la maximisation de l'utilité lors du choix du mode de transport pour chaque tour. L'individu est toujours supposé choisir l'alternative ayant la plus grande utilité. Cependant, ces utilités ne sont pas connues par le chercheur avec certitude, et il doit les considérer comme des variables aléatoires. Donc, la probabilité que la personne va choisir

4 Lecteur intéressé peut trouver une discussion très enrichissante sur ce type de modèle dans Miller et al.

(20)

l'alternative i est égale à la probabilité que l'utilité de l'alternative i soit plus grande ou égale que les utilités de toutes les autres alternatives dans l'ensemble de choix de la personne. Pour que le ménage puisse ensuite décider de l'allocation de l'automobile pour chaque tour, on doit connaître l'utilité de chaque membre du ménage de posséder le véhicule, c'est-à-dire, on doit estimer ces utilités non observables. C'est à ce moment qu'on se sert des estimés provenant des modèles à choix discrets. Une fois qu'on a les utilités de tous les membres du ménage, qu'on connaît toutes les contraintes comme le nombre de véhicules dans le ménage, la contrainte budgétaire, la possession des permis de conduire, horaire de déplacements des membres, etc., le ménage décide l'allocation des ressources en maximisant son utilité agrégée sous toutes les contraintes connues.

Il existe aussi un microsimulateur générant l'horaire des activités des membres du ménage. C'est un modèle basé sur les voyages car l'output est le choix d'un mode de transport pour chaque voyage simulé. De plus, il s'agit d'un modèle basé sur les tours, car le voyage d'un individu peut avoir plusieurs étapes ou tours. Par exemple, la personne peut aller travailler le matin, aller dîner au restaurant, aller à une réunion en après-midi, retourner à la maison, etc. Donc, il faut estimer les coefficients déterminant les utilités pour chaque alternative et pour chacun des tours. Le but de ce mémoire est justement de trouver les estimations des utilités des modes de transport des déplacements reliés au travail entre 6h et 9h la semaine. Voyons maintenant un exemple d'un output pouvant être simulé par TASHA pour bien illustrer sa manière de faire et la place de notre travail dans ce modèle. Considérons seulement la période de 6h à 18h d'une journée typique de la semaine. La figure 2.2 illustre une série de déplacements d'un individu pour cette période.

(21)

Figure 2.2 :

Exemple d'un voyage généré dans le modèle TASHA

choix 1 Maison choix 4 choix 2 Dîner choix 3

L'individu doit choisir un mode de transport pour aller travailler, représenté par « choice 1 » dans la figure. Ensuite, il doit utiliser un moyen de transport pour aller dîner. Et il doit faire les mêmes choix au retour. Il faut remarquer ici que certaines conditions s'imposent. S'il la personne a pris la voiture lors de « choice 1 », elle doit prendre cette voiture aussi lors de « choice 4 ». Aussi, si l'auto a été choisie à « choice 2 », elle doit l'être aussi à « choice 3 ». On aurait pu faire une illustration encore plus compliquée en ajoutant un point pour la réunion, un autre pour aller chercher les enfants à l'école, etc. Les possibilités sont énormes, mais en les ajoutant on augmente le nombre de contraintes et la complexité du processus de décision du ménage.

Ce dernier doit décider de l'allocation des ressources pour les déplacements de ses membres pendant cette période. Supposons que le ménage est constitué de deux membres, que les deux travaillent dans la journée et qu'il y a seulement une voiture. Avant de considérer la situation sur la figure 2, il faut décider quel membre va pouvoir choisir l'auto pour aller travailler. Pour ce faire, le ménage maximise son utilité agrégée en utilisant les utilités de prendre la voiture de ces deux membres et en tenant compte de toutes les contraintes physiques. Aussi, le ménage considère les utilités de ses membres pour les autres modes de transport sujets à leurs disponibilités. Regardons la figure 2.3 pour un exemple de processus décisionnel.

(22)

Figure 2.3 :

Exemple du processus de décision d'un ménage

Ménage avec 1 automobile Individu 1 Horaire 1 U (auto) U (métro) Individu 2 Horaire 2 U (auto) U (métro) 6h 18h

Ici, le ménage doit comparer les utilités pour un mode de transport entre les personnes. Si par exemple, UlA > U\ et U\ > U2M, alors l'automobile est allouée au membre 1 du ménage

(les indices A et M sont pour auto et subway, tandis que 1 et 2 représentent les personnes). On aurait pu avoir une situation où il n'y a pas de conflit de ressource si on avait 2 voitures dans le ménage ou si la personne 2 avait une plus grande utilité avec le mode « subway ». De plus, deux personnes peuvent avoir les activités ensemble, et dans ce cas il est possible de faire le choix du covoiturage. La possibilité de faire du covoiturage ou qu'un membre puisse reconduire d'autres membres à un endroit est présente selon le contexte de voyage. Alors, TASHA pourrait générer une multitude de cas différents. Mais cette complexité a un prix très élevé dans le temps de calcul et le respect des contraintes dont le nombre augmente considérablement avec l'ajout des personnes et des horaires plus chargées.

Les modèles basés sur les tours comme on vient d'en voir un exemple, sont très présents dans les études de demande de transport et dans les simulations urbaines. Ils ont des points

(23)

en communs comme la possession d'un mode principal, ici l'automobile, qui peut déterminer le choix des autres alternatives, la calibration des paramètres selon le contexte, simplification dans la construction des tours, etc. Miller et al. (2003) offrent une bonne revue de littérature pour ce genre de modèle.

Il est maintenant le temps opportun de voir comment notre travail s'incorpore dans la structure de TASHA et ainsi dans le projet ILUTE. Nous avons vu dans l'exemple d'un voyage que le ménage doit comparer les utilités de ses membres lors de conflit et que le modèle compare les utilités des alternatives pour décider le mode de transport pour chaque individu. Il s'agit ici des utilités directes que le modèle calcule pour chaque personne. Cependant, ces utilités ne sont pas observables. Tout ce qu'on observe en pratique est le choix de la personne. On suppose que l'individu qui a choisi de prendre sa voiture pour aller travailler l'a fait car l'auto lui procure une utilité plus grande que tout autre mode de transport. Il est possible d'estimer ces utilités à l'aide des modèles à choix discrets. L'objectif du mémoire est de trouver la meilleure méthode statistique pour estimer les coefficients permettant au modèle TASHA de calculer les utilités des modes de transport pour les individus lorsqu'ils vont travailler le matin pendant la semaine. La prochaine section explique comment fonctionnent les modèles à choix discrets et on verra ensuite plusieurs méthodes d'estimation.

(24)

CHAPITRE 3

LES MODÈLES À CHOIX DISCRETS

La nature de la problématique, le choix modal des individus, impose l'utilisation des modèles à choix discret. Puisque la variable dépendante observée prend les valeurs discrètes, l'individu choisit une seule alternative, et parce que les variables explicatives peuvent être discrètes (par exemple le sexe) ou continues (par exemple le temps de trajet), nous ne pouvons pas estimer un modèle linéaire par les moindres carrés ordinaires (MCO) et nous devons utiliser un autre type de modèles.

3.1 Fondements théoriques des modèles à choix discrets

Les modèles à choix discrets sont normalement dérivés sous l'hypothèse que le preneur de décision suit un comportement de maximisation de l'utilité. Nous allons nous concentrer sur les modèles à utilité aléatoire et nous utiliserons l'abréviation MUA. Nous avons vu que l'individu va choisir l'alternative lui procurant la plus grande utilité. Il choisit donc l'alternative i si et seulement si

Unl>Uv.,\/j*i, (3.1)

où [/pour l'utilité, i,j pour l'alternative et n pour l'individu.

Le chercheur n'observe pas ces utilités mais il possède les données sur le choix que l'individu a fait. De plus, il observe certains attributs des alternatives tels que perçus par le preneur de décision, xnj\/j, et quelques attributs propres à l'individu, Sn. Il peut spécifier

une fonction, qu'on appelle utilité représentative, reliant ces facteurs observés à l'utilité de l'individu

(3.2)

(25)

Comme il y a des aspects de l'utilité qui ne sont pas observables par l'analyste, nous avons Vnj * UnJ. Alors, l'utilité est décomposée comme suit :

J j j (3.3)

où snj capte les facteurs qui affectent l'utilité mais qui ne sont pas inclus dans Vnj. Étant

donné quee^ est définie comme la différence entre la vraie utilité et la partie captée par le chercheur, les caractéristiques de snj , comme sa loi de distribution, dépendent des

spécifications sur VnJ.

Nous sommes alors en présence d'un modèle latent, l'utilité connue par l'individu et présentée dans l'équation (3.3), et d'un modèle observable. Ce dernier est le choix de l'individu observé par le chercheur. Considérons un cas avec m alternatives faisant partie d'un ensemble de choix Cm où yni est le choix observé :

f 1 si l'alternative i est choisie [0 sinon

Pour faire le lien avec le modèle latent, nous supposons que l'individu n a choisi l'alternative i puisque c'est elle qui maximise son utilité. Avec (3.1) nous pouvons lier le modèle latent au modèle observable comme suit :

ri u>v^,*

t [0 sinon

Retournons à l'équation (3.3). Le chercheur ne connaît pas le terme sjn et il le considère

comme une variable aléatoire. La densité jointe du vecteur aléatoire sn = (£n] ,...,£•„_,) est

notée f(sn ) . Avec cette densité, le chercheur est capable de poser des hypothèses sur les

choix de l'individu. La probabilité que la personne n choisisse l'alternative / est Pni =Pr(f/m. >U^j*

(26)

Cette probabilité est une distribution cumulative, c'est-à-dire la probabilité que chaque terme aléatoire snj - eni est plus petit que la quantité observée Vni - Vnj. En utilisant la

densité f{sn), cette probabilité cumulative peut être réécrite :

-eM <Vni-Vnj,\/j *i)f(en)den, (3.7)

où/(-) est une fonction indicatrice égale à 1 lorsque l'expression entre parenthèses est vraie et 0 sinon. C'est un intégral multidimensionnel sur la densité de la portion non observée de l'utilité, f(en). Dépendant des hypothèses posées sur la distribution du terme d'erreur, on

obtiendra différents modèles. L'intégral aura une forme fermée seulement pour certaines spécifications d e / ( ^n) . Logit et logit emboîté ont une forme fermée pour cet intégral. Ils

sont dérivés sous l'hypothèse que le terme d'erreur est distribué Gumbel i.i.d.. Le probit est dérivé sous l'hypothèse que /(£„) suit une normale multivariée, et le logit mixte est basée sur l'hypothèse que la partie non observée de l'utilité consiste d'une partie qui suit une distribution spécifiée par le chercheur plus une partie qui est Gumbel i.i.d. (d'où l'appellation du modèle à noyau logistique). Dans les cas de probit et de logit mixte, l'intégral n'a pas de forme fermée et doit être évaluée numériquement ou à l'aide de simulation5.

Nous avons vu que le choix de la loi de distribution du terme d'erreur détermine le type du modèle. Dans ce qui suit, nous présenterons les caractéristiques théoriques des trois modèles considérés dans ce mémoire : logit, logit emboîté et logit mixte6.

3.2 Logit polytomique

Le modèle à choix discret le plus facile à utiliser est logit. Sa popularité tient à sa caractéristique fondamentale d'avoir une forme fermée de l'intégral de probabilité. Pour

5 En pratique, on évalue numériquement la probabilité de choix pour le modèle ayant jusqu'à 5 alternatives. 6 Voir Ben-Akiva et Lerman (1986 ) pour plus d'information sur le modèle probit.

(27)

dériver le modèle logit, on va supposer que chaque & suit une loi Gumbel i.i.d.. La densité de enJ est

e v , (3.8) et la distribution cumulative est

- e . (3.9)

La variance de cette distribution est de n2/ô et cela implique automatiquement l'échelle de

l'utilité dans le modèle. La moyenne de cette distribution n'est pas zéro mais cela n'importe pas car seulement les différences d'utilités comptent. Si l'on prend la différence de deux termes d'erreur ayant les deux la même moyenne, la nouvelle moyenne de la différence est nécessairement zéro.

La différence entre deux variables de loi Gumbel est distribuée logistique. Si snj et sni sont

de loi Gumbel, alors s*njj = snJ - snj suit une distribution logistique de sorte que la fonction

cumulative est

L'hypothèse clé dans ce modèle est l'indépendance des termes d'erreur. Cela implique que la partie non observée de l'utilité d'une alternative n'est pas reliée à la partie non observée de l'utilité d'une autre alternative. C'est une hypothèse très restrictive et nous verrons d'autres modèles qui la relâchent.

Par contre, l'hypothèse de l'indépendance peut être un résultat naturel d'un modèle bien spécifié. On se rappelle que le terme d'erreur est la différence entre l'utilité observée par l'individu et celle observée par le chercheur. Sous l'indépendance, l'erreur d'une alternative ne donne aucune information au chercheur sur l'erreur d'une autre alternative. Autrement dit, le chercheur a spécifié Vnj suffisamment pour que la partie non observée de

(28)

Nous allons maintenant dériver les probabilités de choix d'un logit. La probabilité que l'individu n choisisse l'alternative i est

Pnl=Pr(Vni+enl>VnJ+enJ,Vj*i)

(3.11)

Si£m est considéré donné, cette expression est la distribution cumulative de chaque snJ

évalué à enl + Vni - Vnj, ce qui selon (3.9) est exp(- exp(- \sni + Vni - Vnj ))). Puisque les

termes d'erreur sont indépendants, la distribution cumulative sur tous les y * i est le produit des distributions cumulatives individuelles :

~\r -4-V -—V • I V n i >» nj}

(3.12)

Bien sûr, sni n'est pas donné et la probabilité de choix est un intégral sur toutes les valeurs

desnj pondéré par la densité (3.8) :

—c —

e

m

e

(3.13)

Après quelques manipulations mathématiques (voir section 3.10 de Train (2002)) on arrive à la forme suivante de la probabilité de choix du logit :

P

ni

=

e

y. (3-14)

Puisque l'utilité représentative est supposée linéaire dans les paramètres, VnJ = /?'xnJ ,

(29)

Les probabilités de logit ont plusieurs propriétés désirables. Premièrement, Pm est

nécessairement entre 0 et 1. Lorsque Vni augmente avec Vnj gardée constante, Pni approche

1, et Pni s'approche de 0 lorsque Vni diminue. La probabilité de logit n'est jamais de 0. Si le

chercheur pense qu'une alternative n'a aucune chance d'être choisie, il va l'exclure de l'ensemble de choix. La probabilité de 1 est obtenue lorsqu'il y a seulement une alternative dans l'ensemble de choix.

Deuxièmement, la somme de toutes les probabilités de choix de toutes les alternatives est égale à 1 :

La relation de la probabilité de logit par rapport à l'utilité représentative a une forme sigmoïde comme dans la figure 3.1.

Figure 3.1 :

Relation entre la probabilité de choix et l'utilité représentative

Si l'utilité représentative d'une alternative est très petite comparativement aux autres, une petite augmentation de l'utilité de cette alternative a un petit effet sur la probabilité d'être choisie. Aussi, si une alternative est tellement supérieure par rapport aux autres, une petite

(30)

amélioration n'augmentera pas beaucoup ses chances d'être choisie. Le point où l'augmentation dans l'utilité représentative a le plus d'effet sur la probabilité de choix se trouve où cette dernière est près de 0.5, donc où la pente de la courbe dans la figure 3.1 est la plus grande.

Nous pouvons remarquer les avantages et les inconvénients du logit dans les trois sujets suivants :

1. Logit peut représenter les variations de goût systématiques (variations qui proviennent des caractéristiques observées de l'individu) mais non pas les variations aléatoires (celles liées aux facteurs non observés).

2. Logit implique la substitution proportionnelle entre les alternatives (basée sur la propriété de l'indépendance par rapport aux modalités non pertinentes (IIA)7).

3. Si les facteurs non observés sont indépendants dans le temps et dans les situations de choix répétées, logit peut capturer la dynamique des choix répétés. Cependant, il ne peut pas le faire si les facteurs non observés sont corrélés dans le temps. Regardons maintenant de plus près les deux premiers points puisqu'ils seront de grand intérêt dans notre travail.

3.2.1 Variations de goût

La valeur que les individus donnent aux attributs des alternatives change selon les personnes. Souvent les préférences changent pour des raisons sociodémographiques comme par exemple le revenu (le coût du mode de transport est moins important pour un individu avec le revenu élevé relativement à un autre individu avec le revenu faible). Mais, les goûts peuvent changer pour d'autres raisons. Deux individus ayant les mêmes valeurs des variables socioéconomiques feront des choix différents.

Les préférences qui varient systématiquement par rapport aux variables observées peuvent être incluses dans logit tandis ce que celles qui changent avec les facteurs non observés ne

(31)

sont pas maniables dans un logit. Pour incorporer les variations de goût de façon optimale, il faut utiliser un probit ou un logit mixte.

3.2.2 Substitution proportionnelle entre les alternatives

Cette caractéristique est le résultat direct de la propriété IIA. Voyons d'où vient cette propriété qui fait à la fois la force et la limitation du logit8. Dans l'approche de l'utilité

constante, les utilités des alternatives sont fixes. Au lieu de choisir l'alternative ayant la plus grande utilité, le preneur de décision se comporte selon les probabilités de choix définies par une fonction de distribution de probabilité (p.d.f.) incluant les alternatives comme les paramètres.

La sélection de la p.d.f. peut seulement être basée sur des hypothèses spécifiques par rapport aux probabilités de choix. La probabilité que l'individu n va choisir l'alternative i dans l'ensemble Cn est Pni = P(i \ Cn) avec les propriétés suivantes

0 <P(i\Cn) < 1, pour tout ieCn, (3.15)

CB) = l. (3.16)

Puisque seulement une alternative peut être choisie, on a

P(i etylC) = 0, i*jzCn (3.17)

P(i ou j\Cn) = P(i\Cn) + P{j\Cn), i*jeCn. (3.18)

Généralement, pour un sous-ensemble de l'ensemble de choixCn ç Ca, on peut écrire la

probabilité que l'alternative choisie s'y trouve

Cn). (3.19)

ieC.

Il est aussi possible de calculer les probabilités conditionnelles suivantes :

(32)

d

n = C

n

)= *k}

C

\, Vi eC.çC,, (3.20)

à condition que P(j\Cn) > 0 pour au moins une alternative j eCn. Pour illustrer, supposons

un exemple du choix de modes transports ayant comme alternative automobile, autobus et marche. L'équation (3.20) implique que l'on peut calculer la probabilité conditionnelle que le mode automobile soit choisi étant donné que le choix se fait entre les alternatives automobile et autobus, et en sachant qu'au moins un des deux modes a une probabilité positive d'être choisi.

Le plus simple modèle d'utilité constante a été construit par Luce (1959) comme le résultat de l'hypothèse suivante, connue comme « l'axiome du choix » :

l'ensemble des probabilités de choix défini pour tous les sous-ensembles de Cn

satisfait l'axiome de choix à condition que, pour tous les i, Cn et Cn tels que

p{i\CnçzCn)=p(i\Cn), (3.21)

quand la probabilité conditionnelle existe.

Autrement dit, si des alternatives sont enlevées de l'ensemble de choix, les probabilités relatives de choix dans le sous-ensemble restent inchangées. Les probabilités de choix dans le sous-ensemble d'alternatives sont dépendantes seulement des alternatives incluses et elles sont indépendantes des autres alternatives qui peuvent exister. On remplace le résultat (3.21) dans la définition de la probabilité conditionnelle (3.20), et on obtient

P(i \Cn) = P(i | C, )p(cn | C, ), i e Cn ç Cn (3.22)

Alors la probabilité de choisir i dans l'ensemble Cn est le produit de la probabilité de

choisir i dans le sous-ensemble Cn fois la probabilité que le choix se trouve dans Cn. La

propriété IIA est obtenue comme suit : p(i\Cn) P(i\Cn) ~

(33)

Cependant, la validité de IIA dépend de la structure de l'ensemble de choix. Supposons que dans l'exemple des modes de transport les probabilités de choix sont

Pn [automobile) = —

Pn (autobus) — —

Pn [marche) — 0

Supposons maintenant qu'un autre service d'autobus est introduit et qui est exactement le même que le service existant sauf qu'il est d'une autre couleur (l'ancien est rouge et le nouveau est bleu). Sous la propriété IIA, le ratio des probabilités de choix est constant et donc les nouvelles probabilités de choix sont

Pn {automobile) = —

Pn (autobus rouge) = —

Pn (autobus bleu) = —.

Cela est pourtant irréaliste car l'individu va considérer les deux services d'autobus comme une seule alternative étant donné que la différence est la couleur. Les probabilités de choix devraient être en réalité les suivantes :

Pn {automobile) = —

P (autobus rouge) = — 4 Pn (autobus bleu) = —.

Donc, pour que la propriété IIA soit valide, l'ensemble de choix doit contenir les alternatives strictement distinctes.

La propriété IIA implique cependant un avantage important pour le modèle logit. En supposant IIA valide, il est possible d'estimer les paramètres d'un modèle de façon consistante avec un sous-ensemble d'alternatives pour chaque individu. Si par exemple l'ensemble de choix contient 100 alternatives, le chercheur peut garder l'alternative choisie

(34)

par l'individu dans l'échantillon et en choisir 9 autres parmi les 99 restantes, et ainsi travailler avec un sous-ensemble de 10 alternatives ce qui réduira considérablement le temps de computation. Cela est possible car les probabilités relatives dans un sous-ensemble d'alternatives ne sont pas affectées par les attributs ou l'existence des alternatives à l'extérieur du sous-ensemble.

3.2.3 Méthodes d'estimation

II existe plusieurs méthodes d'estimation des modèles de choix discrets. Dans les approches classiques, la plus utilisée est le maximum de vraisemblance suivie de la méthode des moments. L'approche bayesienne est également rendue populaire surtout à partir de l'apparition de l'échantillonnage de Gibbs dans le papier de Geman et Geman (1984)9.

Puisque les probabilités de logit ont une forme explicite, la procédure traditionnelle du maximum de vraisemblance peut être appliquée. L'échantillon est composé de N individus. La probabilité que la personne n choisisse l'alternative qu'elle a été observée de choisir peut être exprimée comme suit :

où yni = 1 si la personne choisit i et zéro autrement. En supposant que chaque choix

individuel est indépendant, on obtient la fonction de vraisemblance suivante

n=\ i

où/3 est le vecteur contenant les paramètres du modèle. Il est plus facile de travailler avec le log de cette fonction, et donc la log-vraisemblance est

t (3-26)

9 Les méthodes d'échantillonnage de Gibbs, d'algorithme Metropolis-Hastings et d'augmentation de données

sont expliquées dans différents manuels. Voir par exemple Koop (2003) ou Train (2002) pour une explication moins technique mais très intuitive.

(35)

McFadden (1974) a démontré que cette fonction est globalement concave dans les paramètres ce qui facilite grandement la maximisation numérique. Au maximum de la fonction de log-vraisemblance, sa dérivée par rapport à chacun des paramètres est zéro :

(3.27)

Supposons que l'utilité représentative est linéaire dans les paramètres : Vnj = (3 xnj. En

utilisant (3.26) et la formule pour les probabilités de logit, les conditions de premier ordre (3.27) deviennent

--^K=° (3-28)

n i

En arrangeant des deux côtés et en divisant par N, on obtient

l y y

y

.

x

. = l y y

P x (3

.

2

9)

™ n l -'* n i

Pour voir la subtilité de l'estimation par le maximum de vraisemblance, définissons 3c comme la moyenne des x sur toutes les alternatives choisies par les individus dans l'échantillon: 3c = (l/JV)^ y ynlxnl . De plus, soit x la moyenne des x sur les choix

prédits des individus dans l'échantillon : ic = (l/7V)^ y Pnixni • Pa r l'équation (3.29), ces

deux moyennes sont égales au maximum de la fonction de vraisemblance. Les paramètres estimés de maximum de vraisemblance, /3, sont ceux qui font que la moyenne prédite de chaque variable explicative soit égale à la moyenne observée dans l'échantillon.

Cette propriété de l'estimateur de maximum de vraisemblance prend une signification spéciale pour les constantes spécifiques aux alternatives dans le cas d'un logit. La variable binaire pour l'alternative y est la variable dont la valeur dans l'utilité représentative de l'alternative i est df = 1 pour i = j et zéro autrement. Par (3.29), la constante estimée est celle qui donne

(36)

T7 X X ^m^/ = 77

•*' n i -'*

où Sj est la part de la population dans l'échantillon qui choisit l'alternative j , et S;la part

prédite. Le modèle estimé est alors correct en moyenne avec l'échantillon.

La condition de premier ordre (3.28) a une autre interprétation importante. La différence entre le choix actuel de la personne, yni, et la probabilité de ce choix, Pni, et l'erreur de

modélisation ou le résidu. Le côté droit de (3.28) est la covariance de l'échantillon entre les résidus et les variables explicatives. Les estimateurs de maximum de vraisemblance sont alors les valeurs des paramètres qui rendent les résidus non corrélés avec les variables explicatives. C'est la même condition que dans le cas d'une régression linéaire.

3.2.4 Effets marginaux et élasticités

Puisque les probabilités de choix sont une fonction des variables observées, il est intéressant de voir comment elles réagissent aux changement dans les variables observées. C'est pourquoi les dérivés des probabilités sont calculés. Le changement dans la probabilité que l'individu n choisit l'alternative i étant donné le changement dans un facteur observé, zni, qui entre l'utilité représentative de cette alternative est

d(/-/ A Î i _ ^ k _ ** /.•• dv«i y f* KJÀ* • i ^ ni 1 ^J m [Lje ) = lTLPni(l-Pn,)- (3-30) oz.,

(37)

Si l'utilité représentative est linéaire dans zni avec le coefficient J3Z, la dérivée devient

PzPni()-Pni). Cette dérivée est maximale lorsque Pni =l-Pnl et donc Pnl =0.5. L'effet du

changement d'une variable observée est maximal lorsque les probabilités de choix indiquent un haut niveau d'incertitude, c'est-à-dire lorsque Pnj » 0.5 . Cet effet diminue

lorsque les probabilités approchent 0 ou 110.

On peut également déterminer comment la probabilité de choisir une alternative change quand la variable observée reliée à une autre alternative change. Soitz^. un attribut de l'alternative y". On a la dérivée croisée suivante

- / „ SV.

(1/1

ôV.

= -~KA- (3-31)

0Znj

Quand Vnj est linéaire dans znj avec coefficient pz, la dérivée croisée devient -j3zPniPnJ.

Un aspect intéressant des dérivés des probabilités de choix est que lorsqu'une variable observée change, les changements dans les probabilités de choix doivent s'additionner à zéro. C'est la conséquence du fait que la somme des probabilités doit être égale à 1 avant et après le changement. Alors, augmenter la probabilité de choix d'une alternative fait nécessairement diminuer la probabilité de choix d'une autre alternative.

Les économistes calculent souvent la réaction des probabilités de choix aux changement en terme des élasticités plutôt qu'en terme des dérivées, puisque les élasticités sont normalisées pour les unités des variables. L'élasticité de Pm par rapport à znt est

10 Rappelons que sur la figure 3.1, le changement dans l'utilité représentative a un effet maximal sur la

(38)

E = ®*-?*L '2i S

- SV"' P (\ - P

- ^ ) , (3-32) si Vni est linéaire dans zni avec le coefficient ftz.

L'élasticité croisée de Pnj par rapport à une variable entrant l'utilité de l'alternative j , est

;'V SznjPni

ÔV. = ^ z P.

= -fenA- (3-33)

Cette élasticité croisée est la même pour tous les i : le changement d'un attribut de l'alternative y change la probabilité de toutes les autres alternatives du même pourcentage. C'est une conséquence de la propriété IIA.

La prochaine section traite les modèles GEV (Generalized Extrême Value) qui ont pour caractéristique principale de permettre des structures de la matrice des covariance plus souples que le logit mais en gardant l'attrait principal de ce dernier, la forme fermée de l'intégral de la probabilité du choix. Le logit emboîté fait partie de cette famille de modèles.

3.3 Les modèles du type GEV

Nous avons vu que le modèle logit standard a comme propriété IIA impliquant la substitution proportionnelle entre les alternatives. Cependant, il y a bien des cas où cette hypothèse n'est pas réaliste. De plus, le chercheur n'est pas toujours capable de capter

(39)

toutes les sources de corrélations entre les alternatives dans l'utilité représentative de sorte que la partie de l'utilité non observée devient un simple bruit blanc. Dans ce cas, les termes d'erreur sont corrélés et la IIA ne tient plus. Il faut donc utiliser les modèles permettant des structures plus générales que celle du logit.

Les modèles GEV (Generalized Extrême Value) constituent une grande classe de modèles avec des structures de corrélation flexibles et peu restrictives11. Les termes d'erreur dans

ces modèles sont distribués jointement selon une loi à valeur extrême du type 1. Cette distribution permettant la corrélation entre les alternatives est une généralisation de la distribution Gumbel. Lorsque toutes les corrélations sont nulles, on retrouve la distribution Gumbel pour les termes d'erreur et donc un logit standard. Alors, on peut éventuellement tester si la corrélation est de zéro et si on peut utiliser un logit standard.

Dans ce qui suit, nous verrons le membre de la famille GEV le plus utilisé : logit emboîté (nested logit) à deux niveaux.

3.3.1 Tendances de substitution

Un logit emboîté est approprié lorsque les alternatives peuvent être partitionnées dans plusieurs sous-ensembles, appelés les nids, de façon que les propriétés suivantes tiennent :

1. Pour deux alternatives qui sont dans le même nid, le ratio des probabilités est indépendant des attributs ou de l'existence de toutes les autres alternatives. Donc, IIA tient dans chaque nid.

2. Pour n'importe quelles deux alternatives dans les nids différents, le ratio des probabilités peut dépendre des attributs des autres alternatives dans les deux nids. Alors, IIA ne tient pas en général pour les alternatives dans les nids différents. Prenons un exemple pour illustrer quand un ensemble d'alternatives peut être partitionné12.

Supposons qu'un ensemble d'alternatives disponible au travailleur consiste des options suivantes : conduire une automobile tout seul, covoiturage, autobus ou train. Si une alternative est retirée, les probabilités des autres alternatives devraient augmenter.

11 En français, c'est la loi à valeur extrême du type 1. 12 Train (2002).

(40)

La question est dans quelle proportion les probabilités augmenteront lorsqu'une alternative est exclue?

Supposons que les changements dans les probabilités surviennent comme dans le tableau 3.1. Les probabilités pour l'autobus et le train augmentent toujours de la même proportion quand une des autres alternatives est exclue. Donc, IIA tient pour ces deux alternatives. La même conclusion s'impose dans le cas des deux autres alternatives, l'automobile et le covoiturage. De plus, on voit que si l'on enlève l'alternative l'automobile, la probabilité du covoiturage augmente proportionnellement plus que la probabilité de l'autobus ou du train. Nous pouvons construire deux nids : un appelé auto et qui inclut les alternatives automobile et covoiturage, et l'autre appelée transport en commun incluant les alternatives autobus et train.

Tableau 3.1 :

Exemple de réactions des probabilités de choix suite à l'exclusion des

alternatives de l'ensemble de choix

Probabilités avec alternative exclue Alternative Auto seule Covoiturage Autobus Train Originales .40 .10 .30 .20 Auto seule — .20 (+100%) .48 (+60%) .32 (+60) Covoiturage .45 (+12.5%) — .33 (+10%) .22 (+10%) Autobus .52 (+30%) .13 (+30%) — .35 (+70%) Train .48 (+20%) .12 (+20%) .40 (+33%) —

On peut illustrer les tendances de substitution avec un diagramme en forme d'un arbre comme dans la figure 3.2.

(41)

Figure 3.2 :

Exemple d'un arbre de choix en deux niveaux

Auto Transport en

commun

Auto seule Covoiturage Autobus Train

Nous concluons que la propriété IIA tient dans chaque nid, mais ne tient pas entre les nids. Il y a donc une substitution proportionnelle entre les modes dans les nids mais non pas entre les nids.

3.3.2 Probabilités de choix

Supposons que l'ensemble d'alternatives j est partitionné en K sous-ensembles (nids) dénotés Bi,B2,...,BK. L'utilité que la personne n obtient de l'alternative j dans le nid Bk est

dénotée Unj = Vnj + snj comme d'habitude. Le logit emboîté est obtenu en supposant que le

vecteur des utilités non observées, sn = (enl ,...,£„_,), a la distribution cumulative de type

GEV suivante

(42)

Ici, et contrairement au cas du logit, les termes d'erreur snj sont corrélés dans les nids. Pour

deux alternatives dans les nids différents, la portion non observée de l'utilité est encore non corrélée : Cov[snj, enm ) = 0 pour tout j e Bk et m e B, avec l ^ k.

Le paramètre Ak est une mesure du degré d'indépendance dans l'utilité non observée entre

les alternatives dans le nid k. Une plus grande valeur de Ak implique une plus grande

indépendance et donc une plus petite corrélation. La statistique l-Ak est une mesure de

corrélation dans le sens que si Ak augmente, indiquant moins de corrélation, la statistique

baisse. Si Ak=\, cela indique une indépendance complète dans le nid k, donc pas de

corrélation. Lorsque Ak=\ pour tous les k, la distribution GEV devient le produit des

termes distribués selon la Gumbel. Alors, le logit emboîté devient simplement un logit standard.

La distribution GEV des termes d'erreur donne la probabilité de choix de l'alternative ieBk :

"m _,, / _ ,; ,, u, (3.35)

On peut utiliser cette formule pour montrer que IIA tient dans chaque nid d'alternatives mais non pas entre les nids. Considérons les alternatives i £ Bk et me B,. Puisque le

dénominateur de (3.35) est le même pour toutes les alternatives, le ratio des probabilités est le ratio des numérateurs :

r vm

nm p

(3.36)

Si k = l (c'est-à-dire si i et m sont dans le même nid), alors les facteurs dans les parenthèses s'annulent et on a

(43)

Ce ratio est indépendant de toutes les autres alternatives puisque seulement les alternatives i et m entrent dans la formule. Pour k * l les facteurs ne s'annulent pas et le ratio des probabilités dépends des attributs de toutes les alternatives dans les nids contenant i et m. Par contre, le ratio ne dépend pas des alternatives contenues dans les nids autres que k ou /. Donc, une forme de IIA tient quand même entre les alternatives de différentes nids et on peut l'appeler « l'indépendance des nids non pertinents » ou IIN (independence from irrevelant nests). Alors, avec un logit emboîté, IIA tient entre les alternatives dans le même nid, et IIN tient entre les alternatives des nids différents.

Le paramètre Ak peut différer entre les nids, démontrant ainsi de différentes corrélations

entre les termes d'erreur dans les nids. Le chercheur peut contraindre que Ak soit le même

pour tous (ou certains) les nids. On peut aussi tester la contrainte que Ak = 1 à l'aide d'un

test de ratio de vraisemblance (LR).

La valeur de Ak doit se trouver entre zéro et un pour être consistante avec le comportement

de maximisation d'utilité pour toutes les valeurs possibles des variables explicatives. Pour un Ak>\, le modèle est consistant avec la maximisation de l'utilité pour un intervalle des

variables explicatives et non pas pour toutes les valeurs possibles. Une valeur négative de Ak implique que le modèle n'est pas consistant avec la maximisation de l'utilité et risque

de donner des faux résultats.

3.3.3 Décomposition en deux logits

Les probabilités de choix que nous avons dérivées dans la formule (3.35) peuvent être simplifiées. La composante observée de l'utilité peut être décomposée en deux parties : une partie dénotée W qui est constante pour toutes les alternatives dans le nid, et Y la partie qui varie entre les alternatives dans le nid. L'utilité est réécrite comme suit :

UnJ=Wnk+Ynj+enj. • (3.38)

pour j G Bk, où

(44)

entre les nids mais non entre les alternatives dans chaque nid.

Ynj : dépend des variables décrivant l'alternativey. Ces variables varient entre les

alternatives dans la nid.

Avec cette décomposition de l'utilité, la probabilité du logit emboîté peut être écrite comme le produit de deux probabilités du logit standard. Ainsi l'on peut écrire la probabilité de choisir l'alternative ieBk, comme le produit de deux probabilités, notamment :

"ni = *ni\Bk"nBk ' (3.39)

où Pttj\B est la probabilité conditionnelle de choisir l'alternative i étant donné qu'une

alternative a été choisie dans le nid Bk, et PnB est la probabilité marginale de choisir une

alternative dans le nid Bk.

Il est utile de décomposer Pni parce que les probabilités marginale et conditionnelle

prennent la forme des logits standard. En particulier, celles-ci peuvent être exprimées comme suit :

p

nBk

- /

Knk

ZL > (

3

-

4

°)

. e /ni/h (3.41) OU -"k *->j*Bk

Alors, la probabilité de choisir une alternative dans Bk prend la forme d'un logit. Cette probabilité inclut les variables Wnk qui varient entre les nids mais qui sont constantes entre

les alternatives dans chaque nid. La probabilité conditionnelle de choisir i en sachant que Bk a été choisi est aussi donnée par une formule de logit. Elle inclut les variables Ynj qui

varient entre les alternatives dans le nid. On réfère souvent la probabilité marginale (choix de nid) comme le modèle supérieur et la probabilité conditionnelle (choix de l'alternative dans le nid) comme le modèle inférieur.

Références

Documents relatifs

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

C2 : somme d’une série binaire où 1 est attribué aux pas de temps présentant un stock simulé mais non observé. Un score élevé est alors représentatif d’une fonte

Avec différents jeux de paramètres de départ, une optimisation type « solveur Excel » donne des paramètres extrêmement différents pour des critères relativement proches

Dans le chapitre deux, nous considérons des modèles SIS et SIRS à population non constante et avec n différentes souches de pathogènes d’une maladie infectieuse.. Nous

li s'agit des contraintes dï1umogétK'l(L'. mesure de la satisfa ction que le ménage retire de la consommation du panier de biens. Cette fonction d'utilité est non

An alternative approach is de- rived from Monte Carlo Newton-Raphson procedure [11, 12, ?] and consists in incorporating a Markov Chain Monte Carlo scheme in the gradient step of

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Pour effectuer ce calcul on utilise le fait que R 2 est égal au coefficient de détermination obtenu lorsque l’on fait la régression linéaire multiple de BMI sur (Height, Weight).