Caractérisation de la distribution des ventes

CHAPITRE 2 : MARCHE INTERNET ET RESEAUX PHYSIQUES UNE COMPARAISON

2.3 Comparaison des ventes dans les réseaux physiques et en ligne

2.3.1. Caractérisation de la distribution des ventes

Pour connaître le type de distribution des ventes dans les réseaux hors-ligne et, en particulier, pour estimer la loi de distribution des ventes, nous calculons les ventes totales pour chaque livre sur l’ensemble de la période. Les résultats pourront être comparés à ceux de Ghose et Sundararajan (2006) qui suggèrent que la distribution des ventes en ligne suit une loi de Zipf avec une queue de distribution

de type Pareto (c’est-à-dire proportionnelle à une loi de type puissance). Il est facile de tester si les données sont générées par ce type de distributions, car les lois de Zipf et de Pareto possèdent comme propriété une relation linéaire entre le logarithme du classement des ventes et le logarithme des ventes (en unités). Pour faire cette comparaison, nous calculons le classement des ventes (allant de 1 à 488) et nous faisons une régression du logarithme de ce classement sur le logarithme des ventes. Nous obtenons le résultat suivant :

Log(classement) = 12.44 - 0.77 log(ventes), R2= 0.89, n = 488 (1)

(0.12) (0.01)

La qualité de l’ajustement indique une bonne approximation par une loi de type puissance (Pareto). Cependant le Graphique 2 montre une déviation par rapport à la loi de Pareto pour les meilleures ventes (à la droite du graphique).

Graphique 2 : Régression log du classement – log des ventes sur la totalité des livres hors-ligne

Si l’on estime à nouveau l’équation (1) uniquement sur les classements des livres les plus faibles (c’est-à-dire sur les meilleure ventes, ici inférieur à 6 en logarithme), nous obtenons une pente plus forte avec un coefficient égal à -1.63. Même si la qualité de l’ajustement linéaire est dans ce cas de 0.97 dans son ensemble, on constate une déviation par rapport à la droite de régression pour les

meilleures ventes (Graphique 3 avec le logarithme des ventes en ordonnée, le logarithme des ventes en abscisse et une pente de -0.6128 = 1/-1.63).

Graphique 3 : Régression log du classement – log des ventes sur les meilleures ventes de livres hors-ligne

Nous avons donc rajouté un terme quadratique. Les résultats de la régression indiquent un effet non linéaire qui diminue l’importance des valeurs extrêmes par rapport à la loi de Pareto.

Log(classement) = -5.7 + 3.07 log(ventes) -2.01 log(ventes)², R2= 0.99, n = 488

(0.21) (0.02) (0.05)

L’ajustement quadratique est représenté dans le Graphique 4 et est nettement meilleur que l’ajustement linéaire.9

Graphique 4 : Régression log du classement – log des ventes au carré sur les meilleures ventes de livres hors-ligne

La caractérisation de la distribution des ventes de livres en ligne est moins aisée dans la mesure où il n’existe pas de données agrégées publiques sur le marché du livre. Pour contourner ce problème, certains auteurs ont utilisé des procédures artificielles pour évaluer les ventes de livres en ligne. Goolsbee et Chevalier (2005) utilisent par exemple une procédure qui consiste à acheter une petite quantité d’un livre sur un intervalle de temps très bref pour mesurer la manière dont le classement des ventes augmente. En utilisant cette procédure, ils déduisent que le coefficient de Pareto des ventes en ligne est de l’ordre de -0.82. De manière similaire, Brynjolfsson, Smith et Hu (2003) utilisent les ventes d’un libraire particulier pendant trois semaines pour estimer les coefficients de la régression log-log à 10.526 et -0.87 (en utilisant le classement des ventes Amazon). Mais utiliser cette stratégie pour estimer la distribution des ventes en ligne semble hasardeux dans la mesure où la relation entre le logarithme des ventes et le logarithme du classement des ventes semble linéaire. Nous avons opté pour une autre approche. Nous pouvons calculer une mesure approchée du nombre de transactions associées à chaque livre sur la plateforme MarketPlace qui rassemble des vendeurs professionnels sur le site d’Amazon. Pour ce faire, nous avons relevé l’ensemble des offres postées des vendeurs de livres neufs identifiés dans le top 100 en ligne sur la même période. A partir de ces relevés, nous pouvons tenter de caractériser les ventes de livres. Nous considèrerons, à la lumière du travail de Smith et al. (2008),

qu’une transaction a lieu si un livre disponible à la date t chez un vendeur disparait à la date t+1 et ne revient plus ou revient au plus tôt à la date t+2.10 A l’évidence, les ventes sur la plateforme MarketPlace ne sont pas nécessairement corrélées avec celles d’Amazon ou celles des réseaux physiques, car les internautes qui achètent par l’intermédiaire de MarketPlace souhaitent des prestations différentes en termes de disponibilité immédiate et de qualité de service. Il est néanmoins instructif de caractériser la distribution des ventes sur la plateforme MarketPlace. Pour ce faire, nous estimons les mêmes paramètres que ceux définis pour les ventes de livres dans les réseaux physiques. Les résultats des estimations suggèrent des queues de distribution moins épaisses (Graphique 5 et Graphique 6). Ceci illustre le potentiel de la longue traîne sur le marché des ventes en ligne où l’on observe des ventes plus égalitaires et moins concentrées que sur les marchés physiques.

Graphique 5 : Régression log du classement – log des ventes sur la totalité des livres en ligne (ajustement linéaire)

Pour éviter d'attribuer une transaction lorsqu'il y a un bug de mise à jour du programme automatique qui construit les données, nous avons supprimé les jours pour lesquels moins de 97% des livres n'ont pas été mis à jour.

Graphique 6 : Régression log du classement – log des ventes sur les meilleures ventes de livres en ligne (ajustement quadratique)

Ce travail pourra servir de référence pour les recherches futures sur la comparaison de distributions des ventes en ligne et hors-ligne.

Dans le document Le commerce électronique de biens culturels : contributions empiriques (Page 31-36)