• Aucun résultat trouvé

Liens avec les modèles à utilité aléatoire

L’application des modèles à utilité aléatoire, et plus particulièrement des modèles à valeurs extrêmes généralisées (comme le logit multinomial), à l’analyse des marchés de produits diffé- renciés a été couronnée de succès à la fois sur le plan théorique (Anderson et al., 1992) et sur le plan empirique (Berry et al, 1995). Après avoir présenté brièvement la classe des modèles à utilité aléatoire, cette section met en évidence plusieurs équivalences avec la famille des modèles à élimination des options, pour différents niveaux de généralité.

Présentation des modèles à utilité aléatoire. Dans ces structures, l’utilité fVk associée à une option k se décompose en une utilité déterministe observable vket une variable aléatoire εk de moyenne nulle. Les sujets sont supposés indépendants les uns des autres et statistiquement identiques : chacun d’eux peut alors être représenté par la même variable aléatoire absolument continue. Les modèles à utilité aléatoire supposent que la probabilité de choix est égale à la fonction de distribution cumulée de ε suivant une certaine loi de probabilité. Un exposé formel de ces différents modèles pourra être trouvé dans Anderson et al. (1992, chapitre 2).

Si le comportement d’un agent est le résultat d’un grand nombre de facteurs indépendants, le théorème central limite permet l’emploi d’une loi normale, qui semble la plus pertinente. Ce modèle appelé probit correspond à la forme initiale proposée par Thurstone (1927). Toutefois, l’utilisation du modèle soulève quelques difficultés lorsque le nombre d’options est trop élevé, les termes aléatoires n’étant pas indépendamment distribués.

Une forme plus compacte fournissant des valeurs approchées tout en ayant recours à des termes d’erreurs indépendamment et identiquement distribués a donc rencontré un grand succès : il s’agit de la fonction de distribution logistique (loi de Gumbel). En effet, McFadden (1974) a montré qu’elle conduit à des résultats très proches de ceux obtenus en utilisant la loi normale pour des valeurs suffisamment différentes de 0 ou de 1. Cette loi est à l’origine du nom du modèle logit multinomial (MNL) : comme l’a prouvé Yellott (1977), si la distribution de εk est double exponentielle, alors la probabilité de choix d’une option k parmi un ensemble A est :

PkA= nexp(vk/µ) X

j=1

exp(vj/µ)

où µ désigne une constante positive liée à la variance de la distribution. Si µ → 0 alors PA k = 1

si et seulement si l’utilité de k est la plus élevée parmi toutes les options de A : l’option préférée est toujours retenue, comme dans le modèle néoclassique. A l’inverse, si µ → ∞, les probabilités vérifient PA

k = 1/|A|, ∀k ∈ A : le choix est parfaitement aléatoire. Ainsi, le paramètre µ peut s’interpréter comme un critère d’inobservabilité de l’action ou comme un indicateur des limites à la rationalité du décideur. La principale limite du modèle logit est qu’il vérifie la propriété d’IIA, dont les inconvénients ont été évoqués en section précédente.

Afin de surmonter cette limite, d’autres modèles n’étant pas contraints par cette propriété d’IIA ont été proposés, tout en conservant une forme assez simple et donc aisée à manipuler. Ainsi, le modèle logit emboîté, initialement proposé par Ben-Akiva (1973), permet de modéliser le processus de choix selon une procédure emboîtée à deux ou plusieurs étapes : l’individu choisit d’abord un certain sous-ensemble Al de A = {Al; l = 1...m} regroupant des options possédant plusieurs caractéristiques communes. Puis l’individu choisit une option particulière parmi cet ensemble. Les probabilités de choix à chaque étape sont données par le modèle logit multinomial, d’où le nom de "logit emboîté". Le principal inconvénient du modèle est que les probabilités dépendent du regroupement des options au sein des différents ensembles Ak, qui est défini a priori. Or le choix d’une certaine partition de A ne s’impose pas toujours d’emblée. Plus récemment, un modèle récursif emboîté à valeurs généralisées a été proposé par Daly et Bierlaire (2006). Ce modèle permet des emboîtements à de multiples niveaux (en ce sens, il généralise le travail de Small, 1987). La probabilité de choisir une certaine option dépend de sa position au sein d’un réseau non-cyclique, l’utilité associée à un noeud du réseau étant donné par une formule récursive (comportant les utilités des successeurs immédiats de ce noeud au sein du réseau).

Enfin, soulignons que les modèles logit, logit emboîté et récursif emboîté à valeurs généralisées appartiennent à une classe de "modèles à valeurs extrêmes généralisées" (ou "GEV") mise en évidence par McFadden (1978). Dans cette famille, les agents maximisent une utilité aléatoire dont les différents niveaux sont distribués selon une fonction multi-variée de valeurs extrêmes.

Cohérence entre un modèle à élimination et un modèle à utilité aléatoire. Depuis Block et Marschak (1960), il a été établi qu’un système de probabilités de choix pouvait être représenté comme un modèle à utilité aléatoire si et seulement si il vérifiait une "rationalité stochastique". Cette propriété signifie que la probabilité de choisir une option au sein d’un ensemble est égale à un polynôme comportant la somme des probabilités de tous les classements où cette option est première. Falmagne (1978) a ensuite établi une condition nécessaire et suffisante pour que

cette propriété soit vérifiée : les polynômes de Block-Marschak doivent être non-négatifs7. Plus récemment, en transformant les systèmes de probabilité de choix en systèmes de coefficients de Möbius, Billot et Thisse (2005), ont montré que ces polynômes de Block-Marschak pouvaient s’interpréter comme la probabilité de retirer l’option considérée de l’ensemble de choix.

Ainsi, des structures axiomatiques permettent de montrer si un système de probabilités de choix est cohérent avec les modèles à utilité aléatoire. Or Tversky (1972b, théorème 7) a démontré que les probabilités du modèle EPA vérifient cette rationalité stochastique : le modèle EPA peut donc être reformulé comme un modèle à utilité aléatoire général. Mais cette relation de cohérence existe également dans le sens inverse : en effet, McFadden (1981, p 268-269) a établi, dans une démonstration peu diffusée, que tout modèle à utilité aléatoire peut être reformulé comme un modèle d’Elimination Par Stratégie, tel que nous l’avons présenté en section 3.1. Nous reprenons en Annexe 1 la démonstration de McFadden, en précisant les notations et interprétations de la preuve d’origine. Ainsi, tout système de probabilités vérifiant la rationalité stochastique est également cohérent avec les modèles de type élimination.

Equivalence entre Elimination Par Attributs et Valeurs Extrêmes Généralisées. Le paragraphe précédent a mis en évidence l’existence d’une cohérence réciproque entre les modèles à utilité aléatoire et les modèles à élimination. Toutefois, différents travaux ont fourni des précisions sup- plémentaires sur les relations entre ces classes de modèles, en établissant des conditions formelles d’équivalence. Tout d’abord, le logit multinomial est l’équivalent du modèle de Luce au sein des structures à utilité aléatoire : pour s’en convaincre, il suffit de remarquer que les probabilités de choix du logit peuvent être obtenues à partir de celles du modèle de Luce (équation 3.2) en po- sant simplement u(k) = exp(vk/µ). Cette relation explique pourquoi ces modèles sont affectés de limites similaires, liées à la propriété d’IIA. Ensuite, Batley et Daly (2006) ont identifié des condi- tions formelles sous lesquelles un modèle logit emboîté est équivalent au modèle EPA hiérarchique (évoqué en section 2.2). Ces deux modèles sont, eux aussi, sujets à des limites semblables : les probabilités du logit emboîté dépendent de la partition de l’ensemble des choix et les probabilités du modèle EBA hiérarchique dépendent de l’organisation retenue sous forme d’arbre.

Les relations entre les modèles à utilité aléatoire et les modèles fondés sur des heuristiques d’élimination peuvent alors être représentées par la figure suivante.

7

Fig.4 – Liens entre les différents modèles de choix discrets

Comme le montre ce schéma, Batley et Daly ont également tenté d’établir une équivalence entre le modèle récursif emboîté à valeur généralisée et le modèle EPA, mais sans succès. En effet, il est possible d’identifier une condition d’équivalence entre ces deux structures mais cette dernière entraîne nécessairement une violation de cohérence interne pour l’un des deux modèles. Il semble donc qu’une équivalence formelle ne puisse être trouvée que si les options sont organisées sous forme d’arbre.

Le modèle EPA est doté d’un degré de flexibilité comparable à des modèles à utilité aléatoire relativement sophistiqués, ce qui confirme son potentiel pour une application à la différenciation des produits. Toutefois, l’existence d’équivalences formelles entre ces familles pourrait jeter un doute sur la fertilité potentielle de l’utilisation des fonctions de demande issues de la structure EPA. Les sections suivantes fournissent un début de réponse à cette interrogation en montrant

que les conditions d’application de ce modèle, sur les plans empirique et théorique, diffèrent de celles des modèles à utilité aléatoire (une comparaison détaillée des systèmes de demande sera ensuite fournie au chapitre 2).

4

L’estimation des paramètres du modèle EPA

Cette section discute de l’intérêt du modèle EPA pour l’économie industrielle empirique. Après avoir évoqué les difficultés d’estimation et les premières études réalisées, nous présentons brièvement de nouvelles méthodes d’estimation des paramètres du modèle. Cette analyse suggère qu’une comparaison au cas par cas soit menée avec les modèles à utilité aléatoire, à la fois pour la facilité d’estimation et la qualité des prédictions.

4.1 Les difficultés d’estimation

Les paramètres d’utilité des modèles de choix discrets n’étant pas observables et ne pouvant être déterminés par une démarche de "révélation des préférences"8

, leur estimation s’appuie sur les probabilités de choix qui, elles, sont observables. Dans les modèles à utilité aléatoire, cette es- timation des paramètres a fait l’objet de nombreux travaux. Les méthodes économétriques, basée sur la simulation, sont aujourd’hui très abouties : l’ouvrage de Train (2000) leur est consacré.

L’utilisation des modèles à valeurs extrêmes généralisées pour analyser la différenciation des produits a donné lieu à d’importantes avancées. Les premiers travaux réalisés sur le marché de l’automobile ont ainsi permis de calculer les paramètres de demande et de coût sur une durée importante (Berry et al. 1995), de mesurer l’impact de restrictions commerciales (Goldberg, 1995) ou encore d’analyser la dispersion des prix (Goldberg et Verboven, 2001). Sans être exhaustif, ces études ont ensuite été élargies à d’autres secteurs d’activité comme le marché des camions (analyse des fusions par Ivaldi et Verboven, 2005) ou des ordinateurs individuels (Foncel et Ivaldi, 2005). Soulignons que les principales contributions concernent les marchés de produits sophistiqués ayant fait l’objet d’une décision d’achat importante de la part des ménages, qui y consacrent un budget élevé.

En revanche, l’estimation des paramètres du modèle EPA soulève deux types de difficultés,

8

Les fonctions obtenues par les préférences révélées sont ordinales et donc définies à transformation monotone croissante près (Houthakker, 1950) alors que la fonction d’utilité d’un modèle de choix discrets doit être définie à une transformation linéaire près.

expliquant le faible nombre d’applications du modèle à des cas concrets. D’une part, le nombre de paramètres à déterminer dans le modèle EPA est élevé puisqu’il progresse de façon exponentielle : comme l’ont montré Batsell et al (2003, pp 543-544), un ensemble comportant n options nécessite l’estimation de 2n−n−1 paramètres. Il devient alors fastidieux de concevoir toutes les séquences d’élimination possibles. D’autre part, les paramètres ne sont pas linéaires avec les probabilités de choix, ce qui empêche l’utilisation des techniques économétriques courantes.

Le développement récent de méthodes d’estimation et de nouvelles formes de données semble cependant limiter ces difficultés et appelle à un plus grand pluralisme dans l’utilisation des modèles. Les deux solutions suivantes peuvent être mises en oeuvre :

- la définition d’une structure d’attributs préalable. En limitant le nombre de paramètres, ces contraintes ont permis le développement de certaines méthodes d’estimation (ex : "arbres de préférence"). De plus, l’utilisation des simulations avec la méthode de Monte Carlo par Chaînes de Markov permet aujourd’hui d’estimer la totalité des paramètres du modèle, à condition de connaître la structure des attributs.

- le recours aux "différences de probabilités" lorsqu’on ajoute ou retire une option. Ces différences sont linéaires avec les paramètres du modèle, ce qui permet leur estimation sans qu’il soit néces- saire de supposer une structure d’attributs préalable. En revanche, cette méthode est exigeante en terme d’information sur les probabilités de choix.