• Aucun résultat trouvé

1.3 Typologie des modèles de choix discrets

1.3.2 Logit Emboité

Le modèle MNL, présenté dans la Section précédente, n’est valide que si l’hypothèse IIA est vérifiée. C’est-à-dire qu’il n’y a pas de corrélation entre les facteurs non observés et que l’ajout ou la suppression d’une alternative de choix ne change pas l’ordre de préférence. Du point de vue mathématique cela implique, que le rapport entre les probabilités de choix ne change pas.Debreu(1960) démontre en utilisant le paradoxe du « Bus Bleu – Bus Rouge » que l’IIA n’est pas toujours vérifié. Prenons l’individu qui est indifférent entre faire le trajet en bus bleu ou en voiture. Mathématiquement parlant, la probabilité de choisir l’une des options est 0,5 et le rapport des probabilités vaut 1. Une nouvelle alternative de choix est proposée à cet individu : le bus rouge. Sachant qu’il est indifférent à la couleur du bus, nous nous attendons intuitivement que la probabilité de choisir la voiture reste 0,5. Toutefois l’IIA implique que le rapport des probabilités entre le bus bleu et la voiture reste le même, c’est-à-dire 1. La conséquence de cette hypothèse est que la probabilité de prendre la voiture passe de 0,5 à 1/3(voir encadré 2.2).

Un individu doit se rendre à une destination donnée, pour ce faire il peut prendre soit la voiture, soit le bus bleu. L’individu est indifférent entre les deux modes de transport, c’est-à-dire il a la même utilité pour «prendre bus» et «prendre voiture». Si on retranscrit cela en utilité probabiliste :

P (voiture) = P (busbleu) = 1/2

La mairie décide d’ajouter un bus supplémentaire, mais de couleur rouge. On a un nouvel ensemble A des actions possibles A = {voiture, busbleu, busrouge}.

Sachant que l’individu n’accorde aucune importance à la couleur de bus, on obtient de façon intuitive :

P (voiture, busrouge) = P (voiture, busbleu) = 1/2

PA(voiture) = 1/2

PA(busbleu) + PA(busrouge) = 1 − PA(voiture) = 1/2

Sachant que l’individu est indifférent entre le bus bleu et le bus rouge, on a :

PA(busbleu) = PA(busrouge)

D’où on déduit :

2PA(busbleu) = 1/2

PA(busbleu) = PA(busrouge) = 1/4

Si on suppose que l’Axiome d’IIA est vérifiée, on ne retrouve plus les pro- babilités intuitives. Puisque l’introduction d’un choix supplémentaire ne doit pas affecter les préférences de l’individu et que le rapport des probabilités doit rester le même. C’est-à-dire :

PA(busbleu) = PA(busrouge)

PA(voiture)

PA(busbleu)

= 1

PA(busbleu) = PA(busrouge) = PA(voiture) = 1/3

PA(busbleu) + PA(busrouge) > PA(voiture)

Ce qui est contraire au fait que l’individu est indifférent entre « prendre la voiture » ou « prendre le bus ».

En réponse à ce problème, Ben-Akiva (1973) propose le modèle Logit Emboité (Nested Logit) qui permet de configurer les substitutions entre les actions par une procédure em- boitée en deux ou plusieurs étapes. Le cas du paradoxe « Bus Bleu – Bus Rouge » donne le Logit emboité à deux niveaux avec deux « nids » ou classes, une pour la voiture et une pour le bus. Le premier niveau permet au décideur de choisir s’il prend la voiture ou le bus, le deuxième niveau permet de choisir si le bus est bleu ou rouge. McFadden (1978), quant à lui, propose le théorème des valeurs extrêmes généralisées qui permet de définir n’importe quelle conception du modèle de choix discrets en relâchant l’hypothèse IIA, le Logit emboité y compris. Il prouve aussi que le modèle est consistant avec le principe de maximisation d’utilité.

Le modèle Logit Emboité est utilisé dans le cas où il est possible de regrouper les alter- natives de choix autour des classes appelées « nids » (angl. : nests). Les classes ont les propriétés suivantes :

– Pour deux alternatives quelconques appartenant au même nid l’axiome IIA est vérifié, c’est-à-dire le ratio entre deux alternatives de choix est indépendant de l’absence ou de la présence d’autres alternatives.

– Pour deux alternatives quelconques qui appartiennent à des nids différents, l’axiome IIA n’est plus vérifié. L’ajout d’une nouvelle alternative de choix changera le rapport des probabilités.

Les alternatives se trouvant dans un nid sont plus similaires que les alternatives en dehors du nid : prendre le transport public ou privé, motorisé ou non, acheter une maison ou un appartement. Ou bien, une ou plusieurs alternatives se démarquent des autres. C’est surtout le cas des choix avec l’option « ne rien choisir ».

Le modèle est présenté sous forme d’un arbre à plusieurs niveaux. La Figure 1.1 donne l’exemple issu du livre de Train (2009). Le ménage vivant à San Francisco est face à l’ensemble des logements en vente sur le marché. Il est fort probable qu’il y ait des facteurs non observés qui sont commun aux logements du même quartier (écoles, proximité des transports en commun, proximité et type des commerces). Dans ce cas les utilités non observées ξnj seront corrélées pour toutes les offres de logement du même quartier. On peut s’attendre aussi aux facteurs non observés qui sont communs aux logements avec le même nombre des chambres à coucher. Dans ce cas il y a trois sous-modèles : la probabilité de choisir le logement dans tel ou tel quartier, la probabilité de choisir le nombre des chambres à coucher pour un quartier donné, et la probabilité de choisir l’offre de logement connaissant le quartier et le nombre des chambres à coucher.

Reprenons la formulation générale de l’utilité aléatoire Unj avec j = 1, ..., J les alternatives

Figure 1.1: Logit Emboité à trois niveaux

source :Train(2009)

sont notés C1, C2, ..., Cp, ..., CP. Le modèle suppose que l’utilité non-observable ξnj a pour

fonction de répartitionTrain (2009) :

F (ξnj) = exp  − P X p=1   X j∈Cp exp  −ξnj µp    µp , ∀Cp, 0 ≤ µp≤ 1 (1.21)

Où µp est le degré d’indépendance de l’utilité inobservée pour le nid p et dont la valeur est comprise entre 0 et 1. Avec deux cas extrêmes : 0 pour les alternatives de choix du même nid parfaitement corrélées et 1 pour les alternatives de choix du même nid qui sont indépendantes. Si µp= 1, ∀p alors toutes les alternatives de choix sont indépendantes et le

modèle Logit Emboité se ramène au modèle simple de Logit MultinomialTrain (2009) :

F (ξnj) = exp  − P X p=1   X j∈Cp exp  −ξnj 1    1 = e −e−ξnj (1.22)

Dans le cas contraire, si les deux alternatives j et i se trouvent dans le même nid Cp, alors la covariance Cov(ξnj, ξni) 6= 0. Par contre si j ∈ Cp et i ∈ Cl, la covariance est nulle

∀p 6= l. La probabilité que l’alternative i ∈ Cp sera choisie est (Ben-Akiva,1973) :

Pni= eVniµp  P j∈Cpe Vnj µp µp−1 PP l=1  P j∈Cle Vnj µl µl (1.23)

Si µp est compris entre 0 et 1, alors le modèle est consistant avec le processus de maxi-

pour toutes les valeurs de variables explicatives. Dans le cas contraire, µp < 0, le modèle est inconsistant avec la maximisation d’utilité. En général, µp est une constante estimée

par le modèle et il est donc supposé que tous les décideurs ont la même corrélation pour l’utilité non observée. Il est possible d’introduire l’hétérogénéité en estimant µp en fonction des caractéristiques Zn (revenu, âge, etc.) des décideurs.

Comme dans le cas de MNL, le modèle est estimé en utilisant la méthode de Maximum de Vraisemblance. Par contre la fonction de Log-Vraisemblance du Logit Emboité n’est pas globalement concave et cela a comme conséquence que la solution optimale n’est pas toujours atteinte (Train, 2009). L’utilisation des différents algorithmes d’optimisation est plus que souhaitable (Section1.3.1). Si ce n’est pas suffisant pour trouver un optimum, le modélisateur peut estimer le modèle de façon séquentielle en deux étapes : en commençant par le bas de l’arbre structurel du model (Figure1.1), et corriger par la suite le biais dû à la modélisation (Ben-Akiva et Lerman,1985).

L’autre problème vient de l’estimation du paramètre µp qui représente le degré d’indépen-

dance à l’intérieur du nid. Par construction du modèle, le vecteur des paramètres estimés β est divisé par µp qui est différent pour chaque nid. Cela pose un problème pour l’estimation

des variables génériques, c’est-à-dire qui ont les mêmes effets sur les probabilités de choix pour chaque alternative de choix. Prenons l’exemple de la situation où l’individu doit choi- sir entre faire le trajet en voiture ou prendre les transports publics. S’il compare la durée des deux trajets et préfère le plus court, alors on estimera un seul coefficient générique qui captura l’impact de la durée du trajet sur les probabilités de choix. Par contre le coût du trajet n’est pas directement comparable, parce que le coût de déplacement en voiture est surement plus cher qu’un ticket pour les transports publics. Il est plus logique d’estimer deux paramètres β associés au coût, l’un qui capture l’impact du prix de billet βpublic, l’autre pour capturer le coût de déplacement en voiture βvoiture. Le coefficient générique et

les coefficients propres à chaque alternative des choix sont divisés par µp où p est le numéro

du nid auquel appartiennent l’alternative. Le coefficient générique est mis à l’échelle lors de l’estimation à la fois par µp et par µl, avec p 6= l et µp6= µl : l’égalité µβp = µβ

l ne tient

plus. Cela a pour résultat que le vrai coefficient β n’est plus générique.Hensher et Greene

(2002) etSilberhorn et al.(2007) analysent avec des applications empiriques les différentes configurations des modèles avec les coefficients génériques et les coefficients spécifiques aux alternatives. Le résultat montre que l’utilisation des coefficients génériques avec le degré d’indépendance µp 6= µl, ∀p 6= l propre à chaque nid n’est plus compatible avec le principe

de la maximisation d’utilité. Si le modélisateur veut estimer les coefficients génériques, il est souhaitable de contraindre le degré d’indépendance µp à être le même dans tous les

nids. Par ailleurs dans le cas d’une branche dégénérée, c’est-à-dire quand un nid ne com- porte qu’une seule alternative de choix, il faut contraindre µp à être égal à 1, parce qu’une