• Aucun résultat trouvé

Les joueurs de loto français choisissent-ils leurs numéros au hasard ?

N/A
N/A
Protected

Academic year: 2022

Partager "Les joueurs de loto français choisissent-ils leurs numéros au hasard ?"

Copied!
17
0
0

Texte intégral

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

P. R OGER

M.-H. B ROIHANNE

Les joueurs de loto français choisissent-ils leurs numéros au hasard ?

Revue de statistique appliquée, tome 54, n

o

3 (2006), p. 83-98

<http://www.numdam.org/item?id=RSA_2006__54_3_83_0>

© Société française de statistique, 2006, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

LES JOUEURS DE LOTO FRAN ¸ CAIS CHOISISSENT-ILS LEURS NUM ´ EROS AU HASARD?

P. ROGER, M.-H. BROIHANNE

Universit´e Louis Pasteur, Laboratoire de Recherche en Gestion et en ´Economie Pˆole Europ´een de Gestion et d’ ´Economie

61, avenue de la Forˆet Noire, F-67085 Strasbourg Cedex roger@cournot.u-strasbg.fr,mhb@cournot.u-strasbg.fr

R ´ESUM ´E

Nous montrons dans cet article que les joueurs du loto fran¸cais ne choisissent pas leurs num´eros au hasard. Ils utilisent des strat´egies ou heuristiques communes qui conduisent `a une distribution de probabilit´e des grilles jou´ees diff´erente d’une distribution uniforme. En particulier, il existe une nette pr´ef´erence pour les«petits» num´eros. Ce point est montr´e en utilisant un estimateur simple des num´eros r´eellement jou´es fond´e sur l’existence des rangs de gain incluant le num´ero compl´ementaire. Le r´esultat obtenu n’est pas surprenant car il se conforme aux observations faites dans d’autres pays europ´eens ainsi qu’aux Etats-Unis.

En revanche, la structuration des gains du loto fran¸cais autorise une proc´edure d’estimation beaucoup plus simple que celle utilis´ee dans d’autres pays.

Mots-cl´es : loto, num´ero compl´ementaire.

ABSTRACT

In this paper, we show that french lotto players don’t select numbers randomly. They share some heuristics to choose numbers. This leads to a probability distribution of actually played numbers very different from the uniform distribution. In fact, the data show a clear preference for low numbers. To prove this point, we use a very simple estimator of the probability distribution of played numbers, based on the specific configuration of gains in the French lotto. The result is not surprising; several empirical works show the same kind of preferences in foreign European countries or in the United States. However, the estimator we propose in the present paper cannot be applied to these foreign games, due to the structuration of their prizes.

Keywords : lotto, bonus number.

(3)

1. Introduction

Le 9 f´evrier 2005, le num´ero 53 est sorti `a la loterie de Venise1 , ce qui a enfin ramen´e le calme en Italie. Ce num´ero n’´etait pas sorti depuis 182 tirages et, en d´epit d’interventions t´el´evis´ees de statisticiens expliquant l’ind´ependance des tirages successifs, et du Ministre de l’ ´Economie invitant les Italiens `a la mod´eration, des sommes consid´erables ont ´et´e mis´ees sur ce num´ero, au prix, dans certains cas, de d´etournements de fonds. Le journal italien La Repubblica attribuait 4 morts violentes

`a cette longue s´erie de tirages sans apparition du num´ero 53.

Victor Hugo, dans « Le dernier jour d’un condamn´e » met les paroles suivantes dans la bouche du gardien de prison.

« Voici. Je suis un pauvre gendarme. Le service est lourd, la paye est l´eg`ere;

mon cheval est `a moi et me ruine. Or je mets `a la loterie pour contre-balancer. Il faut bien avoir une industrie. Jusqu’ici il ne m’a manqu´e pour gagner que d’avoir les bons num´eros. J’en cherche partout de sˆurs; je tombe toujours `a cˆot´e. Je mets le 76;

il sort le 77. J’ai beau les nourrir, ils ne viennent pas ».

Ces deux exemples illustrent le fait que les joueurs n’attribuent pas forc´ement aux diff´erents num´eros la mˆeme probabilit´e de sortie puisque, dans le premier, ils lient la probabilit´e de sortie d’un num´ero au nombre de tirages sans apparition de ce num´ero et, dans le second, le gendarme ´evoque des « num´eros sˆurs ».

En France, comme dans beaucoup d’autres pays, les jeux de hasard consti- tuent un ph´enom`ene de soci´et´e dont l’importance ´economique est consid´erable. La Fran¸caise des Jeux r´ealise, avec le seul loto, un chiffre d’affaires annuel de l’ordre de 2 milliards d’euros, alors que son chiffre d’affaires total ´etait de 8,55 milliards d’euros en 2004, ce qui la place parmi les 50 plus grandes entreprises fran¸caises.

L’attractivit´e du loto r´eside dans la simplicit´e du jeu et dans la promesse d’un jackpot tr`es ´elev´e `a chaque tirage. Le jeu a ´et´e cr´e´e pour remplacer la Loterie Nationale d´eclinante et pour faire face `a la concurrence du tierc´e. En effet, le tierc´e pr´esente le caract`ere d’une loterie active puisque le parieur choisit des chevaux alors que la Loterie Nationale ´etait une loterie passive, les num´eros ´etant d´ej`a pr´e-imprim´es sur le billet. Le loto pr´esente ainsi un bon compromis en ´etant un jeu de hasard mais en laissant le joueur choisir les num´eros sur lesquels il souhaite miser.

Le premier tirage a eu lieu le mercredi 19 mai 1976 ; sur le rythme d’un tirage hebdomadaire le mercredi dans les premi`eres ann´ees, il est pass´e `a 2 tirages hebdomadaires (mercredi et samedi) en f´evrier 1984 puis `a 4 tirages par semaine en 1990. Mˆeme si l’engouement pour ce jeu s’est quelque peu ralenti ces derni`eres ann´ees, de 20 `a 30 millions de grilles sont cependant jou´ees `a chaque tirage.

La caract´eristique essentielle du loto r´eside dans le fait qu’il s’agit d’un jeu de pari mutuel. Cela signifie que les gains sont d´efinis comme un pourcentage fixe des mises et sont r´epartis sur l’ensemble des gagnants2. Puisque le joueur est actif

1 Cette loterie fonctionne sur le principe de la loterie g´enoise, c’est-`a-dire que les joueurs misent sur des sous-ensembles de 1 `a 5 num´eros choisis parmi 90. Ce type de loterie existe depuis le 16`eme si`ecle (voir Bradley (2001), Willmann (1999), Roger (2005)).

2 Contrairement `a la loterie italienne ´evoqu´ee plus haut dans laquelle les gains individuels sont fix´es ind´ependamment du nombre de gagnants.

(4)

en choisissant ses num´eros, la question de la distribution de probabilit´e des num´eros effectivement choisis par les joueurs est importante. Or les organisateurs de loteries de ce type, consid´erant sans doute que cette information est strat´egique, ne la rendent pas publique.

Au-del`a de l’aspect statistique du probl`eme, cette question a des cons´equences financi`eres pour le joueur. En effet, le loto ´etant fond´e sur le principe du pari mutuel, avec 50,485 % des mises redistribu´ees, jouer des nombres populaires, s’il en existe, est une strat´egie sous-optimale puisqu’elle diminue la rentabilit´e esp´er´ee du joueur.

Dans cet article nous montrons sur le cas du loto fran¸cais que, d’une part, il existe une nette pr´ef´erence pour les petits num´eros et que, d’autre part, les sp´ecificit´es du loto fran¸cais autorisent l’estimation de la distribution des num´eros jou´es par une m´ethode bien plus simple que celle employ´ee en g´en´eral (voir Farrell et al. (2000)),

`a savoir une m´ethode du maximum de vraisemblance coupl´ee avec une simulation de Monte Carlo. En effet, dans la plupart des pays, une seule combinaison contenant le num´ero compl´ementaire est gagnante, `a savoir l’obtention de 5 num´eros plus le compl´ementaire. En France, trois num´eros corrects et le compl´ementaire assurent un gain. En cons´equence, il existe un grand nombre de gagnants de ce type et ils constituent un large ´echantillon de joueurs dont on est sˆur qu’ils ont jou´e le num´ero compl´ementaire. Cela permet de construire un estimateur des probabilit´es de jouer tel ou tel num´ero.

Les r´esultats que nous obtenons par cette m´ethode simple mais originale confirment ceux obtenus dans d’autres pays `a quelques diff´erences marginales pr`es3. De plus, l’estimation bas´ee sur les propri´et´es du num´ero compl´ementaire est obtenue instantan´ement alors que celle s’appuyant sur la m´ethode du maximum de vraisemblance et la simulation de Monte Carlo de Farrell et al. demande des heures, voire des jours de calcul quand la base de donn´ees comporte un nombre important de tirages4.

Nous montrons que la pr´ef´erence pour les petits num´eros est marqu´ee chez les joueurs du loto de la Fran¸caise des Jeux en consid´erant pr`es de huit ann´ees de donn´ees, soit plus de 1500 tirages. Dans un premier temps, nous proc´edons `a une analyse de r´egression dans laquelle la variable d´ependante est la d´eviation standardis´ee du nombre de gagnants (du gros lot) par rapport au nombre esp´er´e, sous l’hypoth`ese que ce nombre de gagnants suit une loi de Poisson (hypoth`ese v´erifi´ee si les joueurs choisissent leurs num´eros au hasard). La variable ind´ependante de la r´egression est la moyenne des num´eros sortis au tirage officiel. Nous mettons ainsi en ´evidence une relation d´ecroissante entre les deux variables. Le nombre de gagnants est li´e n´egativement `a la moyenne des num´eros tir´es, mˆeme apr`es prise en compte du nombre total de grilles jou´ees.

La seconde analyse montre que si l’on r´ealise une typologie des tirages selon le nombre de gagnants, les distributions des nombres sortis dans les diff´erentes cat´egories ne sont pas identiques, confirmant la tendance apparue dans la premi`ere analyse.

Enfin, `a l’aide des effectifs de gagnants (`a 3 num´eros) ayant jou´e le bon num´ero compl´ementaire, on estime la distribution des nombres effectivement jou´es. Celle-

3 Voir Ziemba et al. (1986) pour le Canada, Scott et Gulley (1995) pour diff´erents lotos U.S., Papachristou et Karamanis (1998) pour la Gr`ece et Farrell et al. (2000) pour la Grande-Bretagne.

4 Roger-Broihanne (2006) mentionnent un temps de calcul de plusieurs jours pour 3638 tirages.

(5)

ci n’a rien d’uniforme. 33 num´eros sur 49 se situent en dehors de l’intervalle de confiance `a 99 % induit par l’hypoth`ese de choix de grilles au hasard. On constate que les num´eros inf´erieurs ou ´egaux `a 13 sont les plus populaires et les num´eros sup´erieurs `a 29 les plus impopulaires. Jouer des petits num´eros implique donc le risque, en cas de gain, de devoir partager le jackpot et diminue ainsi l’esp´erance de rentabilit´e du jeu.

L’article est organis´e comme suit. La section 2 rappelle bri`evement les r`egles du jeu, en particulier celles qui concernent la r´epartition des gains entre les diff´erents rangs. La section 3 pr´esente les diff´erentes m´ethodes de test de l’existence de num´eros pr´ef´er´es et d’estimation de la distribution de probabilit´e des nombres effectivement jou´es. La section 4 d´ecrit la base de donn´ees construite pour l’analyse et r´ecapitule les r´esultats empiriques obtenus sur plus de 1500 tirages. La section 5 conclut l’article en proposant des prolongements de la recherche.

2. Les r`egles du jeu

Jouer au loto est `a la port´ee de tous puisqu’il suffit de cocher 6 num´eros sur une grille en comportant 49. Les joueurs peuvent choisir leurs num´eros eux-mˆemes ou laisser l’ordinateur de la Fran¸caise des Jeux op´erer ce choix. Il s’agit du Syst`eme Flash.

Au tirage officiel, ce sont en fait 7 nombres qui sont tir´es au hasard sans remise, les 6 premiers constituant la grille principale et le dernier ´etant appel´e « num´ero compl´ementaire », num´ero qui joue un rˆole particulier dans la d´etermination des gains.

Il existe 7 possibilit´es de gain (appel´ees « rangs ») `a chaque tirage, et ce depuis le 15/10/19975. Un joueur peut gagner s’il a trouv´e les 6 num´eros de la grille principale ou de 3 `a 5 bons num´eros de cette grille, avec ou sans le num´ero compl´ementaire.

Nous noterons 3 + C, 4 + C et 5 + C les rangs de gain incluant le num´ero compl´ementaire6.

Le tableau 1 r´ecapitule la r´epartition des gains entre les diff´erents rangs.

Rappelons cependant que cette r´epartition porte sur 50,485 % des mises compte tenu du pr´el`evement `a la source. On constate sur ce tableau que les rangs 4 et 5 (resp. 6 et 7) sont regroup´es car une r`egle stipule que les gagnants au rang 4 (resp. 6) touchent un montant double de celui encaiss´e par les gagnants au rang 5 (resp. 7). Le montant d´evolu aux gagnants d’un rang est donc proportionnel au nombre de joueurs mais pas au nombre de gagnants, c’est l’illustration du principe de pari mutuel. En cons´equence, il est plus rentable de jouer des grilles « impopulaires », s’il en existe.

5 Le jeu existe depuis 1976 mais le nombre de rangs de gain a ´evolu´e au cours du temps mais semble stabilis´e `a 7 depuis cette date.

6 3 + C (resp. 4 + C et 5 + C) correspond `a avoir 3 (resp. 4 et 5) bons num´eros de la grille principale, plus le num´ero compl´ementaire.

(6)

TABLEAU 1 La r´epartition des gains

Rang Num´eros corrects 1er tirage 2nd tirage

1 6 29,1% 45,4%

2 5+C 3,1% 3,1%

3 5 10,3% 10,3%

4 et 5 4+C et 4 13,6% 13,6%

6 et 7 3+C et 3 27,6% 27,6%

Report 16,3%

Source : www.fdjeux.com

Par ailleurs, au premier tirage, les sommes d´evolues aux gagnants ne sont pas toutes redistribu´ees. 16,3 % apparaissent sous la mention « Report » dans le tableau 1. Cela signifie que 16,3 % de la part des mises qui devraient ˆetre redistribu´ees lors de ce tirage sont en fait affect´ees aux gagnants du second tirage. L’existence d’un tel report ´etait, au d´epart, justifi´ee par le fait que la participation aux deux tirages n’´etait pas obligatoire `a la cr´eation de ce second tirage. Le report constituait donc, pour les joueurs, une incitation `a cette double participation. Par la suite, la participation aux deux tirages d’un mˆeme jour est devenue obligatoire mais le report est rest´e. On peut l’interpr´eter comme la volont´e de l’organisateur de maintenir, dans les r´esultats publi´es, un jackpot ´elev´e (au moins au second tirage) car l’existence de celui-ci est un argument essentiel dans le marketing de ce type de loterie. On constate d’ailleurs que le pourcentage d´evolu au premier rang est nettement plus ´elev´e au second tirage.

Une grille coˆute aujourd’hui 0,3 euros mais la mise minimale est de 1,2 euros, correspondant `a deux grilles valides pour les deux tirages d’un mˆeme jour. Avant le passage `a l’euro et depuis 1996 la mise ´etait de 2 Frs, soit 0,304 euros.

3. Tests de l’existence de num´eros pr´ef´er´es

Les donn´ees disponibles (voir section 4) permettent de connaˆıtre, outre les num´eros sortis `a chaque tirage, le nombre de grilles gagnantes `a chaque rang et les gains individuels correspondants. Compte tenu des informations contenues dans le tableau 1, il est possible de d´eduire le montant total jou´e et donc le nombre de grilles valid´ees par les joueurs.

3.1. Le caract`ere al´eatoire des tirages officiels

A titre de pr´ecaution, avant l’analyse des num´eros s´electionn´es par les joueurs,` il faut s’assurer que les tirages officiels r´ealis´es par la Fran¸caise des Jeux sont bien al´eatoires. Le test duχ2ne peut ˆetre utilis´e tel quel car si les tirages successifs sont

(7)

ind´ependants, les num´eros d’un mˆeme tirage ne le sont pas, puisque chaque tirage est op´er´e sans remise. On utilise alors la statistique suivante7 :

χ2J= N−1 N−n

N

i=1

(Oi−E)2 E

o`uN d´esigne le cardinal de l’ensemble des nombres `a l’int´erieur duquel se fait le tirage (N = 49),nest le nombre de num´eros tir´es dans la grille principale (n= 6), Oi est la fr´equence du num´eroisur l’ensemble des tirages consid´er´es (en nombre m),Eest la fr´equence th´eorique d´efinie parE=m nN.

χ2J est asymptotiquement distribu´ee selon une loi deχ2 `aN −1 degr´es de libert´e (ddl).

3.2. Num´eros pr´ef´er´es et nombre de gagnants 3.2.1. Neutralisation du volume des ventes

L’existence de num´eros pr´ef´er´es peut ˆetre test´ee `a partir de l’intuition suivante.

Sous l’hypoth`ese d’un choix al´eatoire de num´eros par les joueurs, le nombre de gagnants au premier rang doit ˆetre d´etermin´e par la quantit´e de grilles vendues et pas par les num´eros sortis au tirage officiel. Or les ´etudes mentionn´ees plus haut ont montr´e que, dans plusieurs pays, les joueurs ont tendance `a s´electionner des petits num´eros. De ce fait, un moyen simple de tester cette hypoth`ese consiste `a ´etablir une relation entre le nombre de gagnants au premier rang et la moyenne des num´eros sortis au tirage officiel. NotonsN6k etXk ces quantit´es pour le tiragek;N6 etX d´esignent les vecteurs `amcomposantes contenant les valeurs de ces variables pour lesmtirages.

Si Qk grilles ont ´et´e jou´ees au k-`eme tirage, le nombre de gagnants au premier rang, not´eN6k, suit, sous l’hypoth`ese de choix al´eatoire, une loi de Poisson de param`etre λk = Qkp o`u p d´esigne la probabilit´e de gain au premier rang (p = 6!43!49 = 1

13983816 = 7,15×108 pour le loto fran¸cais). En effet, chaque grille jou´ee peut ˆetre vue comme un essai pour obtenir le gros lot. Dans ces conditions, le nombre de gagnants suit une loi binomiale de param`etresQk etp. Compte tenu de l’ordre de grandeur de ces param`etres, l’approximation par la loi de Poisson est justifi´ee.

Pour neutraliser l’ordre de grandeur des ventes, on centre et r´eduit le nombre de gagnants au premier rang en posant :

Zk= N6k−λk

√λk Le vecteurZ =

Z1, ..., Zm

donne ainsi les d´eviations standardis´ees du nombre de gagnants par rapport au nombre esp´er´e.

7 Voir Joe (1993) ou Stern et Cover (1989).

(8)

La mise en ´evidence d’une pr´ef´erence pour les petits num´eros peut alors ˆetre r´ealis´ee en r´egressantZsurX `a l’aide du mod`ele :

Z=aX+b1+ε

o`u1est un vecteur de dimensionmdont toutes les composantes sont ´egales `a1,aet bd´esignant les coefficients de la r´egression etεla perturbation.

L’hypoth`ese nulle de choix al´eatoire de num´eros s’´ecrit alors H0 : a = 0 puisqu’en cas de choix al´eatoire, la moyenne des num´eros tir´es ne doit pas influencer le nombre de gagnants.

3.2.2. Typologie des tirages selon le nombre de gagnants

Une alternative pour r´ealiser ce test consiste `a constituer des classes de tirages selon le nombre de gagnants au premier rang et `a r´epartir les 49 num´eros en sous- ensembles (par exemple 7 sous-ensembles de 7 num´eros). Sous l’hypoth`ese nulle, il ne devrait pas y avoir de diff´erence dans la r´epartition des num´eros dans les diff´erentes cat´egories. En revanche, si une pr´ef´erence marqu´ee existe pour les petits num´eros, ceux-ci devraient ˆetre surrepr´esent´es dans les tirages comptant plusieurs gagnants au premier rang et sous repr´esent´es dans la cat´egorie de tirages sans gagnant.

Nous montrerons dans la section suivante que les petits nombres (inf´erieurs `a 28) apparaissent plus souvent dans les tirages `a plus de 3 gagnants et les nombres sup´erieurs `a 29 dans les tirages sans gagnant. Il est bon de rappeler ici que le nombre moyen de grilles jou´ees `a chaque tirage est proche de 25 millions, ce qui donne une esp´erance du nombre de gagnants au premier rang, en cas de choix al´eatoire, proche de 2 (plus pr´ecis´ement,25×106×7,15×108= 1,79).

3.2.3. Les proportions de gagnants avec num´eros compl´ementaires

Le tableau 2 rappelle les probabilit´es de gain pour les 7 rangs. On constate qu’en cas de choix al´eatoire des num´eros par les joueurs, la probabilit´e de gagner au rang 3+C sachant que l’on a 3 num´eros corrects s’´ecrit :

pc = C422 ×C63

C422 ×C63+C423 ×C63 = C422

C422 +C423 =C422

C433 = 0,0697

En divisant la population des tirages selon le num´ero compl´ementaire, on peut, pour chaque tirage, obtenir une estimation de cette probabilit´e. Notons, pour le tirage k,N3k etN3+Ck les nombres de gagnants aux rangs 7 et 6 etpˆkc la proportion des gagnants au rang 6 dans l’ensemble des gagnants aux rangs 6 et 7. On a donc :

ˆ

pkc = N3+Ck N3+Ck +N3k

Sick d´esigne le num´ero compl´ementaire du tiragek, on estime la probabilit´epicde gain au rang 6 conditionnellement `a un gain aux rangs 6 ou 7 lorsque le num´ero

(9)

TABLEAU 2 Probabilit´es de gains

Rang Num´eros Combinaisons Probabilit´e de

gagnants gagnantes gain

1 6 1 7,15×10−8

2 5+C 6 4,29×107

3 5 C421 ×C65= 252 1,8×10−5 4 4+C C421 ×C64= 630 4,5×105 5 4 C422 ×C64= 12915 9,23×10−4 6 3+C C422 ×C63= 17220 1,23×103 7 C423 ×C63= 229600 1,64×10−2

compl´ementaire estipar :

ˆ pic= 1

mi mi

k=1

ˆ

pkc1{ck=i}

o`umi d´esigne le nombre de tirages dont le num´ero compl´ementaire esti. Il reste ensuite `a tester les 49 hypoth`eses nullesH0:pic=pcpouri∈ {1, ...,49}. Lorsque cette hypoth`ese nulle est rejet´ee, c’est le signe qu’un num´ero est plus (ou moins) populaire que la moyenne.

4. ´Etude empirique 4.1. Les donn´ees

On peut t´el´echarger l’historique des r´esultats depuis l’origine du jeu sur le site de la Fran¸caise des Jeux8 . Les informations fournies sont la date, le jour de la semaine, le num´ero du tirage de l’ann´ee, le num´ero de tirage du jour (1 ou 2), les nombres de gagnants et les gains individuels `a chaque rang. Le tableau 1, indiquant les cl´es de r´epartition des mises, permet de reconstituer le nombre de grilles vendues, en prenant toutefois la pr´ecaution de tenir compte du changement de devise en 2002 et du taux de pr´el`evement « `a la source ».

En effet, la grille coˆutait 2 Frs avant le passage `a l’euro (soit 0,304 euros) alors que son prix a ´et´e arrondi `a 0,3 euros apr`es cette date. Il est important de noter que

8 www.fdjeux.com ou www.loto.fr pour le site du loto.

(10)

le tableau 1 est rest´e stable depuis 1997 mais ces cl´es de r´epartition ont chang´e `a de nombreuses reprises depuis 1976. Pour reconstituer les ventes sur toute la p´eriode, il faut alors tenir compte de l’´evolution du taux de pr´el`evement et des cl´es de r´epartition des gains. Toutes ces informations figurent sur le sitewww.sojah.comqui contient tous les textes l´egislatifs (anciens et actuels) sur les jeux de hasard en France.

Nous avons proc´ed´e `a l’estimation des ventes `a partir du pourcentage des mises redistribu´ees aux rangs 4 et 5, soit 13,6 %, plutˆot qu’`a partir des rangs 6 et 7 pour deux raisons. La premi`ere est li´ee aux arrondis. En effet, les gains sont arrondis au dixi`eme d’euro inf´erieur; il est donc pr´ef´erable de choisir un rang avec un nombre plus faible de gagnants. La seconde raison est plus importante; pendant la p´eriode d’´etude, les r`egles concernant le report des sommes non gagn´ees au premier rang ont ´et´e modifi´ees.

En ce qui concerne le premier tirage, ces sommes sont maintenant redistribu´ees aux rangs 6 et 7, ce qui complique quelque peu le calcul. Notons cependant que cette pr´ecaution conduit encore `a une l´eg`ere sous-estimation des ventes. En effet, le nombre de gagnants est de l’ordre de 30 000 aux rangs 4 et 5, ce qui conduit en moyenne `a une sous-estimation de 1 500 euros des sommes redistribu´ees `a ce rang. Cela conduit `a une sous-estimation du nombre de grilles vendues de l’ordre de

(0,136×0,150050485×0,3) = 72823, c’est-`a-dire environ 0,3 %.

Nous avons, dans cet article, retenu les 1534 tirages officiels r´ealis´es depuis le 15 octobre 1997 jusqu’au 16 f´evrier 2005. Le choix de la date de d´ebut de p´eriode est justifi´e par l’apparition des 7 rangs de gain `a cette date.

Sur cette p´eriode, en moyenne, il y a eu 1,7 gagnants au premier rang et ils ont empoch´e 952 000 euros chacun. 426 tirages, soit plus de 25 %, se sont sold´es sans gagnant au premier rang et 446 avec un seul gagnant. La distribution du nombre de ces gagnants du gros lot (6 num´eros corrects), tout en ´etant tr`es concentr´ee, fait apparaˆıtre quelques « points aberrants » qui expliquent l’´ecart entre moyenne et m´ediane. En effet, le nombre maximum de gagnants est de 38 et 8 tirages sur les 1534 ont eu plus de 10 gagnants.

Concernant les grilles jou´ees, la moyenne sur l’ensemble de la p´eriode est de 24,5 millions avec un minimum `a 17,9 millions et un maximum `a 60 millions. Cette variabilit´e des ventes est en partie due au fait que la Fran¸caise des Jeux peut, de temps

`a autre, annoncer une « Super-Cagnotte » attractive qui va stimuler la demande de grilles. Cela survient en g´en´eral apr`es un ou plusieurs tirages sans gagnant. C’est en particulier cette grande variabilit´e des ventes qui impose de neutraliser le volume des ventes dans l’analyse de la relation entre moyenne du tirage et nombre de gagnants (section 3.2.1). Par ailleurs, on peut mentionner, mais ce n’est pas l’objet de cet article, que le 13 f´evrier 2004 a d´ebut´e le premier loto europ´een appel´e Euromillions, dont le tirage a lieu le vendredi, chaque grille coˆutant 2 euros. Notre p´eriode d’analyse comporte donc 1323 tirages avant cette date et 212 tirages apr`es cette date. Cet

´ev´enement a bien sˆur pour cons´equence de modifier le comportement d’achat des joueurs de loto puisque certains ont op´er´e une substitution entre les deux jeux. En particulier, le nombre moyen de grilles vendues est de 24,88 millions avant le 13 f´evrier 2004 et tombe `a 22,47 millions apr`es. Un test usuel de comparaison de moyennes montre que cette diff´erence est largement significative.

(11)

4.2. Les tirages officiels

La figure 1 repr´esente les fr´equences d’apparition des 49 num´eros dans les 1534 tirages. La fr´equence th´eorique est de 187,84 (= 649×1534) et les fr´equences observ´ees varient entre 167 et 215. Toutefois la statistiqueχ2J `a 48 ddl vaut 33,79 pour une valeur critique de 65,16 au seuil de 5 %. On ne peut donc rejeter l’hypoth`ese de tirages officiels al´eatoires, ce qui est plutˆot rassurant pour les joueurs. Le mˆeme calcul effectu´e sur les num´eros compl´ementaires donne une valeur de la statistique de 49 avec une fr´equence th´eorique de31,30 = 153449 et des fr´equences observ´ees variant de 21 `a 41. On ne peut, l`a non plus, rejeter l’hypoth`ese de tirage al´eatoire pour les num´eros compl´ementaires.

0 50 100 150 200 250

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 Numéros

Fréquence

FIGURE 1

Fr´equences des num´eros dans la grille principale

4.3. R´egression du nombre de gagnants sur la moyenne des tirages

Le tableau 3 pr´esente les r´esultats de la r´egression r´ealis´ee sur les 1534 tirages dans le mod`eleZ =aX+b1+εo`uZest la d´eviation standardis´ee du nombre de gagnants etXd´esigne la moyenne des num´eros tir´es `a chaque tirage. Le coefficienta a le signe attendu si les petits num´eros sont pr´ef´er´es et ce coefficient est tr`es largement significatif puisque la valeur du t de Student associ´ee est de −9,72. Le R2 de la r´egression est ´egal `a 0,058.

Cette analyse de r´egression sur l’ensemble des tirages est cependant d´elicate

`a interpr´eter plus avant car il est bien connu que les coefficients de r´egression sont fortement influenc´es par les valeurs extrˆemes. Or il existe quelques tirages pour lesquels le nombre de gagnants est tr`es ´elev´e puisque le maximum est de 38 gagnants le 17 octobre 2001. Si on se limite aux tirages pour lesquels le nombre de gagnants est inf´erieur ou ´egal `a 10, on ´elimine 8 tirages de la base de donn´ees mais les r´esultats sont similaires. LeR2passe `a 0,076 et le coefficient deXdevient−0,063 avec une valeur dutde Student ´egale `a−11,19. On peut donc bien attribuer les r´esultats obtenus au

(12)

TABLEAU 3 Probabilit´es de gains

Coefficient Ecart-type´ tde Student

b 1,7 0,182 9,32

a −0,069 0,007 −9,72 R2 0,058 Fisher : 94,60

fait que le nombre de gagnants est significativement plus important quand la moyenne du tirage est faible.

4.4. Typologie selon le nombre de gagnants

Nous avons distingu´e les tirages selon le nombre de gagnants au premier rang en nous appuyant sur l’intuition suivante : si les joueurs cochent de mani`ere pr´ef´erentielle de petits num´eros, ceux-ci devraient ˆetre associ´es aux tirages dans lesquels il y a un grand nombre de gagnants.

Le tableau 4 distingue 3 cat´egories de tirages correspondant `a 0 gagnant, 1 ou 2 gagnants ou plus de 3 gagnants. Ces trois cat´egories sont not´ees 0, 1-2 et 3+; le nombre moyen de grilles vendues par tirage varie tr`es peu entre les trois cat´egories puisqu’il oscille entre 24,5 millions (1-2) et 25,7 millions (3+).

Notons Sj, j = 1, ...,7 les sous-ensembles de 7 num´eros compris entre 7(j−1) + 1et7jet le nombre de sorties des num´eros dans la cat´egorie de tiragesk.

Sous l’hypoth`ese de choix al´eatoire, l’esp´erance du nombre de sorties dans chaque sous-ensemble est ind´ependante du nombre de gagnants au premier rang (et donc de la cat´egoriek), et ´egale `a6/7. En effet, sur un ensemble demtirages,6mnombres sont tir´es et6m/7en moyenne appartiennent `a chaque sous-ensemble de 7 num´eros.

Compte tenu de cette remarque, les r´esultats sont pr´esent´es dans le tableau 4 sous

la forme 7

m

k=1

nkj

6m , les sous-ensemblesjapparaissant en lignes et les cat´egories de gagnants en colonne. La figure 2 repr´esente les colonnes du tableau 4; les triangles correspondent `a la cat´egorie 3+, les carr´es `a la cat´egorie 1-2 et les losanges `a celle sans gagnant. Les nombres inf´erieurs (sup´erieurs) `a 1 traduisent ainsi une sous (sur) - repr´esentation du sous-ensemble de num´eros consid´er´es. La derni`ere ligne du tableau indique la valeur duχ2`a 6 ddl pour chaque cat´egorie de gagnants, l’effectif th´eorique ´etant calcul´e par rapport `a une distribution uniforme sur les sous-ensembles de num´eros. Il apparaˆıt que dans la cat´egorie sans gagnant ainsi que dans la cat´egorie

`a plus de 3 gagnants, l’hypoth`ese nulle peut ˆetre rejet´ee avec des valeurs calcul´ees de 53,47 et 64,14. Les donn´ees du tableau montrent aussi que les rejets ont des causes

« sym´etriques », `a savoir une sur-repr´esentation des num´eros ´elev´es dans la cat´egorie sans gagnant et une sous repr´esentation de ces mˆemes num´eros dans la cat´egorie `a

(13)

plus de 3 gagnants. Par contre, l’hypoth`ese nulle ne peut ˆetre rejet´ee dans la cat´egorie interm´ediaire, mˆeme au seuil de 10 %, car leχ2 calcul´e vaut 3,24. Ce r´esultat est sans doute li´e au fait que le nombre de grilles jou´ees est en moyenne de 25 millions, ce qui correspond `a un nombre esp´er´e de gagnants de 1,79 (cf. section 3.2.2) sous l’hypoth`ese d’un choix al´eatoire. Ces tests confirment bien l’impression « visuelle » de la figure 2.

TABLEAU 4

Fr´equences relatives de sous-ensembles de 7 num´eros Nombres 0 gagnant 1-2 gagnants 3+ gagnants

N tirages 426 751 357

1 `a 7 0,860 0,977 1,206

8 `a 14 0,772 0,974 1,265

15 `a 21 0,926 1,000 0,990

22 `a 28 0,997 0,991 1,042

29 `a 35 1,137 1,044 0,863

36 `a 42 1,115 1,036 0,748

43 `a 49 1,194 0,977 0,886

χ2 53,47 3,24 64,14

0,600 0,750 0,900 1,050 1,200

1 2 3 4 5 6 7

Sous-ensemble de nombres

0 gagnant 1-2 gagnants 3+ gagnants

Écart relatif

FIGURE 2

Fr´equences relatives des sous-ensembles de num´eros selon le nombre de gagnants

(14)

4.5. Estimation de la distribution des nombres jou´es

Afin d’affiner l’analyse, nous testons maintenant l’hypoth`ese de « popularit´e » ou d’impopularit´e de certains num´eros en nous appuyant sur le num´ero compl´emen- taire. Rappelons que l’estimateur de la proportion de gagnants `a 3+C dans l’ensemble des gagnants `a 3 ou 3+C ´etait donn´e, dans la section 3.2.3 par :

ˆ pic= 1

mi mi

k=1

ˆ

pkc1{ck=i}

Sur les 1534 tirages, les 49 num´eros sont sortis en tant que num´ero compl´e- mentaire entre 21 et 41 fois. En cas de choix al´eatoire des num´eros par les joueurs, la valeur th´eorique de pc est ´egale `a 0,0697 (voir section 3.2.3) pour chacun des 49 num´eros. Nous avons donc r´ealis´e 49 tests de l’hypoth`ese nulle pic = pc. Les r´esultats sont r´esum´es sur la figure 3. Les deux courbes en traits pleins encadrant la valeur th´eorique repr´esentent les intervalles de confiance `a 99 % pour chacun des num´eros. Les valeurs observ´ees se situent sur la courbe comportant des triangles comme identificateurs. Pour 33 num´eros sur 49, l’hypoth`ese nulle est rejet´ee au seuil de 99 % dans un test bilat´eral9. Conform´ement aux remarques faites dans les analyses pr´ec´edentes, les petits num´eros, inf´erieurs `a 13 sont significativement plus jou´es que les autres (`a l’exception du num´ero 2) alors que les num´eros sup´erieurs `a 29 le sont significativement moins (`a l’exception du 45 et du 49).

Ecart

0,05 0,06 0,07 0,08 0,09 0,1 0,11

1 5 9 13 17 21 25 29 33 37 41 45 49

propcomp infconfiance supconfiance

FIGURE 3

Intervalles de confiance des proportions de gagnants `a 3 + C

Il s’ensuit qu’en termes de rentabilit´e esp´er´ee d’une grille, jouer 5-7-9-11- 12-13 est la plus mauvaise strat´egie, mˆeme si, comme nous l’avons montr´e dans la

9 Les r´esultats chiffr´es sont disponibles sur demande.

(15)

section 4.2, les tirages officiels sont faits au hasard et que, par cons´equent, chaque grille a la mˆeme probabilit´e d’ˆetre tir´ee. A l’inverse, la grille 32-38-39-40-41-47 est celle dont on peut attendre la rentabilit´e esp´er´ee la plus ´elev´ee.

Bien ´evidemment, ces commentaires doivent ˆetre relativis´es puisqu’ils suppo- sent que le comportement (et les pr´ef´erences de num´eros) des joueurs est stable dans le temps.

Il est permis de s’interroger sur la raison qui pousse les organisateurs (dans tous les pays) `a ne pas d´evoiler directement ces informations en diffusant pour chaque tirage l’histogramme des num´eros jou´es10. Une explication possible est que ceux-ci souhaitent ´eviter les « mouvements de foule », `a savoir la concentration des jeux sur les grilles peu jou´ees aux tirages pr´ec´edents. En effet, les joueurs savent que les gains sont partag´es du fait du principe du pari mutuel et pourraient chercher `a s´electionner les combinaisons peu jou´ees. La plupart d’entre eux adoptant le mˆeme raisonnement, l’effet obtenu serait, pour les joueurs, contraire `a l’objectif recherch´e. Ce ph´enom`ene serait g´en´erateur de d´eceptions pour les clients du produit phare de la Fran¸caise des Jeux. En cas de gain, ils encaisseraient des sommes faibles et la concentration des mises sur certaines combinaisons engendrerait un pourcentage ´elev´e de tirages sans gagnant au premier rang. Ce raisonnement fait fi de l’hypoth`ese de rationalit´e parfaite si souvent pos´ee dans les mod`eles ´economiques mais l’anecdote « italienne » relat´ee au d´ebut de cet article illustre le caract`ere peut-ˆetre irr´ealiste de cette hypoth`ese dans le contexte des jeux de hasard11.

5. Conclusion

Dans cet article, nous avons montr´e que les joueurs du loto de la Fran¸caise des Jeux ne choisissent pas leurs num´eros au hasard et ont une pr´edilection pour les

« petits » num´eros. Ce r´esultat a ´et´e obtenu `a partir d’outils statistiques ´el´ementaires et d’informations publiques, mˆeme si le pr´esent travail a n´ecessit´e l’organisation de ces informations provenant de plusieurs sources.

Il est donc surprenant de ne pas trouver ce genre d’analyse sur les multiples sites web consacr´es `a ce jeu alors que la plupart d’entre eux diffusent des informations comme les ´ecarts, c’est-`a-dire le nombre de tirages pendant lequel un num´ero donn´e n’est pas sorti. Or, cette information est sans valeur compte tenu de l’ind´ependance des tirages successifs.

Cette ´etude peut ˆetre prolong´ee dans plusieurs directions. Une question naturelle consiste `a se demander s’il est possible, par un choix judicieux de num´eros, de transformer un jeu largement d´efavorable (compte tenu du pr´el`evement `a la source) en un jeu dont l’esp´erance de rentabilit´e est positive. Les m´ethodes employ´ees par Ziemba et al. (1986) ou Papachristou et Karamanis (1998) pourraient ˆetre utilis´ees `a cette fin.

10 Simon (1999) a obtenu de la soci´et´e Camelot, organisatrice du loto britannique, l’histogramme des num´eros jou´es pour un seul tirage et montre que l’hypoth`ese de choix au hasard des grilles peut ˆetre rejet´ee.

11 Voir Broihanne et al. (2004) pour des exemples sur les march´es financiers.

(16)

Deux autres questions int´eressantes sont, d’une part, de d´eterminer l’influence des Super cagnottes sur la demande de grilles et, d’autre part, d’analyser l’existence d’une cannibalisation ´eventuelle entre les diff´erents jeux de hasard.

La premi`ere analyse reste cependant difficile sur le loto fran¸cais car les sommes non gagn´ees `a un tirage donn´e ne sont pas syst´ematiquement report´ees sur le tirage suivant, contrairement `a ce qui se passe sur la plupart des lotos ´etrangers12.

Nous avons en revanche montr´e par un test ´el´ementaire que la moyenne des ventes a baiss´e depuis le d´emarrage de l’Euromillions, ce qui incite `a poursuivre une

´etude plus d´etaill´ee du ph´enom`ene de substitution.

Remerciements

Nous remercions les rapporteurs du comit´e de r´edaction pour les remarques et suggestions ayant permis d’am´eliorer le texte.

R´ef´erences

[1] BEENSTOCK M. et HAITOVSKY Y. (2001), Lottomania and other Anomalies in the Market for Lotto, Journal of Economic Psychology, 22, 721-744.

[2] BRADLEY R. E. (2001), Euler and the Genoese Lottery, WP, Adelphi Univer- sity.

[3] BROIHANNE M.-H., MERLI M. et ROGER P. (2004), Finance Comporte- mentale, Economica.

[4] FARRELL L., HARTLEY R., LANOT G. et WALKER I. (2000), The Demand for Lotto : The Role of Conscious Selection, Journal of Business & Economic Statistics, 18, n2, 228-241.

[5] JOE H. (1993), Tests of Uniformity for Sets of Lotto Numbers, Statistics &

Probability Letters, 16, n3, 169-251.

[6] PAPACHRISTOU G. et KARAMANIS D. (1998), Investigating Efficiency of Betting Markets : Evidence from the Greek 6/49 Lotto, Journal of Banking and Finance, 22, 1597-1615.

[7] ROGER P. (2005), Lotomania : approche scientifique du jeu et du comportement des joueurs, Editions Village Mondial.

[8] ROGER P. et BROIHANNE M.-H. (2006), Efficiency of Betting Markets and Rationality of Players : Evidence from the French 6/49 Lotto, Journal of Applied statistics, `a paraˆıtre.

12 Voir Beenstock et Haitovski (2001).

(17)

[9] SCOTT F.A. et GULLEY O. D. (1995), Testing for Efficiency in Lotto Markets, Economic Inquiry, 33, 175-188.

[10] SIMON J. (1999), An Analysis of the Distribution of Combinations Chosen by UK National Lottery Players, Journal of Risk and Uncertainty, 17 :3, 243-276.

[11] STERN H. et COVER T. (1989), Maximum Entropy and the Lottery, Journal of the American Statistical Association, 84, n408,980-985.

[12] WILLMAN G. (1999), The History of Lotteries, Mimeo, Stanford University.

[13] ZIEMBA W.T., BRUMELLE S.L., GAUTHIER A. et SCHWARTZ S. (1986), Dr Z’s 6/49 Lotto Guidebook, Dr Z Investments, Vancouver.

Références

Documents relatifs

Exercice 3 Compl´eter le tableau suivant : si le nombre appartient `a l’ensemble de nombres, le r´e´ecrire sous une forme adapt´ee, sinon mettre une croix dans

Pourtant, la guilde n’est pas considérée comme une bande d’amis : parce qu’elle regroupe des joueurs de niveaux différents et parce que l’engagement y est industriel, les

➢ A l’aide de la règle et du compas, le joueur construit alors le point symétrique de sa voiture par rapport à l’axe ou au centre.. La trajectoire de la voiture est symbolisée

 La partie se termine sur une victoire lorsque les joueurs sont parvenus à reconstituer entièrement l’igloo pour sauver l’esquimau ; ou sur une défaite

Abdel et Marc sont deux adeptes de ce jeu de bowling et chacun prétend être le joueur le plus performant, c'est à dire faire le meilleur score avec la

 Les joueurs ne disposent pas de planche, ils doivent déterminer seuls les ob- jets à chercher pour le bain, le dîner ou le coucher (but identique ou non pour les

Lorsqu’un joueur arrive sur une case « étoiles », il recule (ou avance) d’autant de cases qu’il y a d’étoiles.. Lorsqu’un joueur arrive sur la case « Voler »,

Nouveauté 2019 : pour la 10ème édition de l’évènement, les organisateurs de la Vendée Va’a proposent en exclusivité mondiale, un parcours de 45 kms sur 3