• Aucun résultat trouvé

On peut obtenir le Logit comme sous-produit de la dérivation du modèle gravitaire de Wilson (1967) : il y apparaît comme l’arrangement le plus probable si on impose une contrainte de

Marc Gaudry

F. Demande finale et flux sur le réseau On la retrouve bien dans la

25. On peut obtenir le Logit comme sous-produit de la dérivation du modèle gravitaire de Wilson (1967) : il y apparaît comme l’arrangement le plus probable si on impose une contrainte de

coût total à la maximisation de l’entropie. On peut aussi le trouver en réarrangeant le modèle « de

demande aléatoire rationnelle » de Theil (1975), comme l’a souligné Truong (1981). Enfin, Leo-

Probit qui comporte des intégrales multiples26sans pour autant fournir

des résultats très différents, et par le développement de trois complé- ments qui ont émergé simultanément en 1977 : (i) celui des structures

hiérarchiques emboîtées ; (ii) celui des formes fonctionnelles souples ;

(iii) et celui des coefficients de régression aléatoires. Quelques mots sur chacun, dans l’ordre de leur popularité à ce jour, afin de pressentir leur rôle considérable dans les modèles de trafic et leurs propriétés en situation de prévision pour un projet : on ne peut comprendre ce comportement sans prendre conscience des trois compléments.

Hiérarchisation des choix : du Logit Multinomial au Logit Hiérar- chique. Le plus connu de ces compléments, bien décrit dans les

manuels (e.g. Ortúzar et Willumsen, 2001), est celui des hiérarchies de modèles emboîtés (nested). Elles ont été créées principalement pour pallier27cette insupportable propriété du modèle Logit qui est l’égalité

des élasticités croisées de la demande.

Cela signifie que, si on utilise la formulation multinomiale (15)- (16), l’implantation d’un service d’autocars sur horaire ou d’une piste cyclable entre Paris et Lyon obtiendra toujours son marché en captu- rant sur cette liaison la même proportion de chacun des modes exis- tants (train, avion, voiture). De même, l’ajout d’un nouvel itinéraire dans un modèle de choix entre trajets par un même mode (et en l’absence de congestion) réduira dans une même proportion les flux des itinéraires existants.

En formulant une hiérarchie à deux niveaux, on contourne en partie le problème : si, par exemple, on suppose qu’au niveau supé- rieur le choix se fait entre l’avion, la marche à pied et l’ensemble des modes terrestres motorisés, et qu’au second niveau il ne se fait qu’entre ces modes terrestres, qu’arrivera-t-il ? L’élasticité croisée de la part de marché sera la même entre les modes d’un niveau donné, mais elle ne sera plus identique entre chacun des modes du niveau inférieur et un mode appartenant au niveau supérieur : dans notre exemple, elle ne sera plus identique entre tous les modes terrestres motorisés particuliers et l’avion ou la marche à pied. Il faut donc,

26. Dans un des modèles nationaux suédois formulés par Staffan Algers, la région de Stoc- kholm comprend 80 zones où l’on peut faire ses achats. Si l’on arrive à estimer un Logit avec 80 alternatives, c’est bien autre chose d’estimer un Probit, même linéaire. Et que dire dans le cas de villes plus grandes et de fonctions d’utilité non linéaires.

27. La justification technique met à contribution les corrélations supposées entre les erreurs non observées associées à chaque fonction d’utilité de type (16). Malheureusement, les nombreuses et diverses hiérarchies ainsi concevables ne sont pas strictement comparables par des tests statisti- ques : sans véritable mesure commune et continue entre elles, elles semblent fonctionner ou ne pas fonctionner dans des situations-types.

parmi toutes les hiérarchisations données, en formuler certaines qui donneront des résultats raisonnables.

L’instrument critique et la pierre d’angle de cette hiérarchisation est la découverte en 1977, simultanément et indépendamment, par McFadden28et par Williams (1977), que l’espérance maximale de l’uti-

lité de l’ensemble des alternatives (en gros ce que l’on peut attendre de mieux du menu des choix disponibles) est égale au logarithme naturel du dénominateur du modèle Logit (le logsum), expression appelée aussi officiellement valeur inclusive I des alternatives considérées :

I≡{1n(

m e

Vm

)}. (17)

On insère alors cette valeur inclusive, une sorte d’indice agrégatif non linéaire, comme variable explicative du choix au premier niveau. Cette opération peut en principe être répétée si l’on a un troisième niveau.

Les hiérarchies sont d’usage commun aujourd’hui et il n’est guère de modèles un peu complexes, définis pour une agglomération ou au niveau national, qui n’en comprennent. Elles sont très utilisées pour comparer l’attractivité de diverses destinations commerciales, chacune se voyant attribuer, à partir d’une origine donnée, son propre « panier » de modes de transport (la valeur inclusive de l’utilité des modes de transport utilisables pour y accéder). Si la très grande majo- rité des modèles hiérarchiques sont de forme linéaire (16), un nombre grandissant utilisent des formes souples (e.g. Deepack et Laferrière, 1994, ou Lapparent, 2006), thème de notre prochain paragraphe.

Formes fonctionnelles souples Box-Cox. Une autre façon d’amélio-

rer le Logit Multinomial, cheville ouvrière du choix modal et étape généralement décisive de toute étude de la demande de transport, est en effet de soumettre à l’épreuve des données l’hypothèse de linéarité de (16) en utilisant à cette fin la transformation non linéaire la plus utilisée en économétrie selon Davidson et MacKinnon (1993), la trans- formation de Box et Cox (1964). Elle est définie pour toute variable positive Varvcomme29:

28. Dans une communication présentée à la Third International Conference on Behavioural Travel Modelling (Tanunda, Australie) en avril 1977 et publiée l’année suivante (McFadden, 1978). 29. Nous ignorons donc ici le coefficient µ défini dans l’article de Box et Cox (1964) et nous en tenons à la définition commune. Par ailleurs, lorsque la variable dépendante y d’un modèle n’est pas transformée mais que ses variables explicatives le sont, on dit parfois Box-Tidwell (1962) plutôt que Box-Cox, mais nous négligerons cette pratique. Il est aussi possible, à certaines conditions, de transformer une variable continue (autre qu’une constante) qui contient des observations nulles à condition d’ajouter à la variable transformée une indicatrice compensatoire associée aux observa- tions nulles.

(18)

ce qui permet de réécrire (16) dans la forme Logit Box-Cox Standard :

(19)

où nous avons négligé les indices t des observations pour alléger l’écri- ture. Aux qualités suivantes – un meilleur ajustement aux données, des propriétés théoriques plus générales que celles de la forme linéaire et la possibilité de modifier profondément les résultats de régression en affectant jusqu’aux signes30 des coefficients des variables, s’ajoute le

fait que l’usage des transformations rend les valeurs du temps variables selon le point de référence du tarif et du temps et la quantité de temps épargné : la première minute gagnée a une valeur qui dépend de la base de la modification et les minutes suivantes n’ont plus la même valeur que la première. On constate aussi que le Logit Box-Cox (15), (18)-(19) comprend comme cas particulier le modèle multiplicatif pré- cédent (14).

Une autre manière de comprendre le rôle de la non linéarité des variables est de constater qu’elle implique que la courbe de réaction de la part modale par rapport à une modification d’une variable qui nous intéresse, comme la vitesse de transport du mode i, n’est plus symétri-

30. Il faut se rappeler qu’en régression multiple le signe du coefficient d’une variable explica- tive ne dépend pas seulement de la corrélation simple entre cette variable et la variable dépen- dante, ou de sa variance propre : elle dépend aussi de la covariance entre toutes les variables explicatives. Comme les variables transformées voient leurs variances individuelles et leurs cova- riances modifiées par ces transformations, c’est l’existence même de la corrélation statistique qui est déterminée par leur usage. En effet, il est tout à fait possible, comme le savent tous les praticiens de la régression tant classique que logistique, que le signe d’une variable explicative soit positif et significatif si la variable est insérée de manière linéaire mais que ce même signe devienne négatif et significatif si la variable est insérée sous forme logarithmique. Pour des exemples de tels change- ments extraits de la littérature économique et des transports, tant en régression logistique que classique, voir Gaudry et al (1998). Plus généralement, seules les données peuvent décider de la forme optimale et donc conjointement de l’existence de la corrélation statistique (de sa force, de son signe et de son degré de fiabilité) et de celle de la forme de la relation, existences toutes deux douteuses en l’absence de tests conjoints.

que par rapport à un point d’inflexion localisé à pi= ½, comme l’indi-

que la courbe en gras du cas linéaire sur la Figure 3.

Ce schéma illustre, dans une représentation à deux modes, l’effet sur la probabilité de choix p1de diverses valeurs d’une transformation

Box-Cox appliquée à une variable X1. Si en effet on croit que le

phénomène qui nous intéresse (réaction à la vitesse améliorée d’un mode de transport, etc.) implique une représentation asymétrique de l’effet sur la probabilité qui nous intéresse, alors la variable explicative responsable de cet effet n’intervient pas linéairement dans la fonction d’utilité du modèle Logit, et cela indépendamment du nombre de modes considéré. Toutefois, la même variable explicative peut induire une courbure de forme différente selon le mode considéré et spécifique à chacun d’entre eux.

Du point de vue économique, on peut dire que la linéarité repré- sente un cas de rendements marginaux constants parce que, par exem- ple, la minute marginale du temps de transport a alors le même effet sur la probabilité de choix du mode concerné indépendamment de la longueur du déplacement, contrairement à ce qui se passe dans le modèle Logit Box-Cox Standard caractérisé par (19). C’est tout diffé- rent dans un modèle non linéaire et l’impact sur la valeur du temps peut être décisif tout en redressant des résultats linéaires invraisembla- bles (Gaudry et al, 1989). Du point de vue économique on pourrait penser, tant en théorie de la production qu’en théorie de la consomma-

Figure 3

tion, que la linéarité est, comme dans la nature, la moins vraisemblable des formulations31.

Généralisation du Logit Box-Cox Standard. Élaboré en 1976-1977

et publié par Gaudry et Wills en 1978, ce modèle qui généralisait le modèle en usage (Rea et al, 1977) fut immédiatement utilisé pour faire les prévisions de demande pour le réseau aérien canadien (Transport Canada, 1979). Malgré les coûts de calcul plus importants que ceux de la version linéaire, le modèle Box-Cox Logit Standard est maintenant d’usage courant dans nombre de pays, tant à l’échelle urbaine qu’inte- rurbaine, et autant pour des problèmes de voyageurs que de marchan- dises.

Dans sa version généralisée, ce modèle rend aussi possible une incarnation pratique du Logit Universel de McFadden (1975) qui cher- che à utiliser tous les prix (ou niveaux de service) de tous les modes dans toutes les fonctions d’utilité, selon :

(20)

Ce modèle Logit Box-Cox Généralisé (15) et (20) ramène en fait le Logit dans le giron des systèmes complets de demande. On l’applique aux flux marchandises à travers les Pyrénées (Gaudry et al, 2006). En modifiant profondément la structure des erreurs de (16) par l’ajout de variables « manquantes » en situation d’utilité séparable et donc res- ponsables par leur absence32 des corrélations supposées entre ces

erreurs, variables dont la présence rend aussi possible la complémen- tarité entre les modes, il pourrait devenir un concurrent sérieux du Logit hiérarchique. En effet, par structure, il viole l’axiome IIA et rétablit des élasticités croisées normales entre les modes. On sait par ailleurs que la non linéarité a des effets profonds sur le comportement du Logit en prévision, comme l’a bien démontré l’article de Mandel et

al (1997). Sur la Figure 3, on constate que modifier X1de 2 à 4 ou à 6

implique des gains très différents de la part de marché p1 selon la

valeur estimée du paramètre de puissance Box-Cox.

31. Rétrospectivement, on peut penser que la nature multiplicative de la loi de Newton n’était pas intuitive dans la mesure où notre intuition perçoit plus facilement les corrélations entre variables linéaires qu’entre logarithmes des mêmes variables. C’est peut-être aussi pourquoi son application aux flux de transport prit si longtemps après 1684.

32. En économétrie, il est rarissime que la corrélation entre les erreurs soit un phénomène aléatoire pur : elle est normalement l’effet de variables pertinentes absentes. En ce sens, le Box- Cox Logit Généralisé rétablit leurs présences.

Coefficients aléatoires et « Mixed Logit ». Formulé et exploré dès

197733 par Johnson (1979a, 1979b), le Logit à coefficients aléatoires,

aussi appelé « Mixed34Logit », est resté dans l’ombre jusqu’à sa redé-

couverte récente et sa reformulation au goût du jour (McFadden et Train, 2000).

Il pose des problèmes difficiles de formulation des hypothèses sur la distribution et l’estimation des valeurs des paramètres (Johnson, 1977, 1978) et sur la matrice d’information des variables (Cirillo, 2005)35. S’il

est déjà difficile d’avoir, pour un individu, une idée juste de la valeur relative pour lui-même des coefficients du tarif, du temps de marche, d’attente ou de transport, comment alors avoir des notions claires et infirmables sur leurs distributions dans la population ? Le problème est plus difficile encore pour les variables socioéconomiques comme le sexe ou le revenu : la distribution du coefficient de la variable indica- trice « homme » est-elle arc tangente ou semblable à celle de la testos- térone ? Et cette distribution varie-t-elle par mode de transport ou est-elle nécessairement « générique » ?

Plus important peut-être du point de vue de son avenir semé d’embûches (Hensher et Greene, 2003), une chose au moins est claire : ce modèle revient en partie à prendre en compte la courbure associée à chaque variable. Dans ce sens, Orro et al (2005) ont montré que sa récente popularité était peut-être due justement au fait que les vérita- ble relations ne sont pas linéaires et qu’il faut plutôt estimer leurs courbures au lieu de les supposer connues et d’introduire des coeffi- cients aléatoires : ces auteurs nous ramènent eux-mêmes explicitement à la pertinence des transformations de Box et Cox discutées plus haut.

Intersection entre choix modal et affectation. Il est clair qu’en

combinant les composants formulés dans les étapes précédentes aux parts de marché ou probabilités de choix entre les modes définies à cette étape-ci, on obtient un modèle de demande par mode et par paire origine-destination. Par exemple, la combinaison de (12) et d’une représentation générale d’un modèle de parts, Logit ou autre, permet d’écrire ainsi ce résultat :

Tijm= Tijpijm. (21)

33. Source : discussion avec l’auteur en avril 1977 à la Third International Conference on Behavioural Travel Modelling de Tanunda en Australie.

34. Pas au sens de « mixed up » comme on pourrait le craindre si l’on a conscience des rendements marginaux décroissants, voire négatifs, en modélisation de la demande qui a toujours été un exercice de construction d’individus représentatifs identifiables par les segments de marché. 35. « Its information matrix does not have a closed form and hence its efficiency bound is not

qui, plus explicitement, se formule36:

Tijm= f(Ai, Aj, Uij)•{Uijm

/

m Uijm}, m = 1, ..., M (22)

avec un indice de l’utilité globale des modes Uijdéfini sans prendre le

logarithme37de la somme comme en (17) :

Uij=

m Uijm, (23)

indice qu’on adaptera à nos fins immédiates, sans perte de généralité, à l’aide d’une spécification plus simple de ses termes que celles qu’on trouve en (19) ou (20), afin de mettre en lumière le groupe des Xijmk

dont nous voulons discuter la provenance :

Uijm= exp [

k bkX]ijmk, (24)

En fait, nous avons toujours supposé plus haut dans l’exposé que l’ensemble {Xijmk} des K caractéristiques des M modes était bien dis-

ponible pour toutes les paires origine-destination et qu’elles avaient une valeur modale unique pour chaque paire. Mais nous n’avons pas expliqué comment ces valeurs de réseau (le prix et le temps, pour l’essentiel) étaient calculées. Nous voulons le faire brièvement dans le cadre d’une présentation simple de la quatrième étape, celle du choix d’itinéraire appliqué à chaque réseau modal et qui permettra de calcu- ler les valeurs des Xijmk.

On voit bien que, si les demandes sont définies de i à j mais que les réseaux sont composés de liens s partagés par les flux de plusieurs paires origine-destination, la tâche de cette étape d’affectation par réseau sera bien de générer des valeurs uniques des caractéristiques immédiatement utilisables dans les fonctions de demande et, simulta- nément, reflétant bien l’usage du réseau pour ces niveaux de demande compatibles avec elles au sens d’un équilibre Demande-Performance.

36. Le problème de savoir si l’on doit estimer les paramètres des deux modèles conjointement ou séquentiellement est autre chose. Laferrière (1988) a montré les gains importants d’une estima- tion conjointe. On peut conjecturer qu’ils seraient plus grands encore si l’on s’intéressait dans (22) aux variables qui sont présentes dans les deux parties du modèle. Si, en 1975, les modèles de choix modal utilisaient surtout des variables de réseau, elles incorporent de nos jours beaucoup de variables socio-économiques dont on peut penser que leur rôle premier est plutôt dans la partie génération-distribution du modèle. Pour stopper cette dérive « all in » des modèles de choix modal, le développement de l’estimation conjointe introduite par Laferrière sera nécessaire malgré les coûts de calcul importants qu’elle implique. On peut penser que certaines variables socioéconomi- ques comme le sexe ou le revenu auront simultanément un rôle dans les deux parties du modèle, ce que les tests de sous-estimation conjointe clarifieraient.

37. On peut ensuite tester la notion de valeur inclusive en établissant la forme optimale du membre gauche de (22).

On voit aussi aux Figures 1 et 2 que ces valeurs d’équilibre impli- quent par définition un calcul compliqué parce que les niveaux des caractéristiques varient avec les niveaux des flux. Dans le cas contraire de niveaux de service ou de performance invariants aux niveaux des flux, la procédure d’équilibre en sera simplifiée. Encore faudra-t-il que, si plusieurs itinéraires sont utilisés pour une liaison donnée, leurs valeurs soient colligées et exprimables par des mesures uniques par paire origine-destination, conformément aux exigences des formula- tions des fonctions de demande.

L’affectation aux réseaux : des courbes de trafic « détourné » à l’équilibre. Dans un premier temps, on utilisa des « courbes de diver-

sion » de type (13) pour expliquer le choix entre des infrastructures de classes différentes, comme les autoroutes et les voies urbaines, en reliant la part du trafic qui utilisait un genre d’infrastructure au ratio des temps de transport et parfois à la distance. Mais l’usage du temps de transport exigeait de mettre en œuvre une procédure de calcul qui les restituait pour les utiliser dans (13) : elle était à toutes fins utiles manuelle.

Une solution beaucoup moins approximative et bien plus satisfai- sante apparut en 1957 avec le début du calcul des chemins les plus courts dans un réseau et l’implantation informatisée d’algorithmes adéquats (Moore, 1957 ; Dantzig, 1960), algorithmes et logiciels d’affectation utilisés pour la première fois à grande échelle dans CATS (1959-1962). Cette solution est toujours appliquée de nos jours quand il n’est pas important d’obtenir une affectation sur plus d’un chemin reliant deux localisations. Par ailleurs, comme le chemin le plus court est unique par définition, sa restitution par l’algorithme rencontre automatiquement le souhait de produire une mesure unique utilisable dans la fonction de demande.

Dans le cas où plusieurs chemins semblent utilisés et qu’il faille en tenir compte, deux types de cas se présentent selon qu’on cherche ou non à modéliser la congestion. En l’absence de congestion, il faut rendre compte de l’usage apparent38et simultané de plusieurs chemins

de longueurs différentes. Un calcul du chemin le plus court est donc par hypothèse insuffisant.

38. Cet impression fondée sur les données peut n’être due par exemple qu’au niveau d’agréga-