• Aucun résultat trouvé

ou poursuivre le tirage, avec comme esp´erance de gain suppl´ementaire E(r, n)

N/A
N/A
Protected

Academic year: 2022

Partager "ou poursuivre le tirage, avec comme esp´erance de gain suppl´ementaire E(r, n)"

Copied!
2
0
0

Texte intégral

(1)

Enonc´e noG116 (Diophante)

Solution de Jean Moreau de Saint-Martin

Si le tirage est poursuivi jusqu’au bout, le gain estR−N (ou la perteN−R).

Il en est de mˆeme si le tirage est interrompu al´eatoirement par un ´ev´enement ext´erieur. En effet l’esp´eranceE(R, N) ob´eit `a la relation de r´ecurrence E(R, N) = (1 +E(R−1, N))R/(R+N) + (E(R, N −1)−1)N/(R+N) car le premier tirage fait passer `a la situation (R−1, N) en rapportant 1 avec la probabilit´eR/(R+N), ou `a la situation (R, N−1) en rapportant−1 avec la probabilit´eN/(R+N). Cette r´ecurrence a pour solutionE(R, N) =R−N. Tout change si le joueur a le choix du moment o`u arrˆeter. S’il rester cartes rouges etncartes noires `a un certain moment, le choix strat´egique est entre – arrˆeter et en rester au gain d´ej`a acquis,

– ou poursuivre le tirage, avec comme esp´erance de gain suppl´ementaire E(r, n).

Le joueur va maximiser son gain en arrˆetant quand (et seulement quand) E(r, n)≤0.

Cela revient, pour l’´evaluation de l’esp´erance de gain, `a remplacer E(r, n) par max(0, E(r, n)) =G(r, n). On aura alors la r´ecurrence

G(R, N) = max

0, R

R+N (1 +G(R−1, N)) + N

R+N (G(R, N −1)−1)

A l’´evidence G(0, N) = 0 et G(R,0) =R. Pour R etN allant jusqu’`a 4, on obtient le tableau des valeurs deG(R, N)

R= 0 1 2 3 4

N = 0 0 1 2 3 4

1 0 1/2 4/3 9/4 16/5

2 0 0 2/3 3/2 12/5

3 0 0 1/5 17/20 58/35

4 0 0 0 12/35 1

La r´ecurrence permet aussi d’obtenir des formules en R pour les premi`eres valeurs de N.

G(R,1) =R2/(R+ 1) =R−1 + 1/(R+ 1) G(R,2) =R(R−1)/(R+ 1) =R−2 + 2/(R+ 1)

G(R,3) =R−3 + 9/(R+ 1)−12/(R+ 2) + 6/(R+ 3) pourR≥1

Ces expressions ne font pas apparaˆıtre de loi plus g´en´erale, ceci tenant sans doute au caract`ere non lin´eaire de la fonction max(O, x). Pour approfondir cet aspect, je note que l’expression D(R, N) = CR+NR G(R, N) v´erifie la r´ecurrence

1

(2)

D(R, N) = max0, D(R−1, N) +D(R, N−1) +CR+N−1N −CR+N−1R qui conduit pour N donn´e `a exprimerD(R, N) comme polynˆomes enR de degr´e N + 1, au moins par intervalles. Un moyen de “localiser” les non- lin´earit´es est de consid´erer les diff´erences (N + 2)-i`emes

H(R, N) = ∆N+2D(R, N) =

N+2

X

k=0

(−1)kCN+2k D(R+N + 2−k, N) qui s’annulent sur les intervalles o`u D(R, N) s’exprime comme un mˆeme polynˆome. Mais les suites obtenues ne s’av`erent pas plus faciles `a interpr´eter ou `a extrapoler :

5D(R,3) = 2, 0, 0, 0, . . ., pour R= 0, 1, 2, . . .

6D(R,4) = 12,−3, 0, 0, 0, . . .

7D(R,5) =−23,−3, 2, 0, 0, 0, . . .

8D(R,6) =−498, 184,−28, 0, 0, 0, . . .

Du point de vue de l’action du joueur, il serait suffisant d’avoir une r`egle simple d’arrˆet en fonction de r etn. Le tableau desG(R, N) fait apparaˆıtre qu’il faut arrˆeter quandr n’est pas sup´erieur `a n−1(1≤n≤2), n−2(3≤ n ≤ 5), n−3(6 ≤ n ≤ 10), n−4(11 ≤ n ≤ 16), n−5(17 ≤ n ≤ 23), n−6(23≤n≤26). On peut approcher ces valeurs-limites parn−√

n, mais je n’ai aucune justification qui permettrait d’´etendre cette r`egle au-del`a de n= 26.

En programmant le calcul num´erique de la r´ecurrence pour R et N allant jusqu’`a 26, j’ai obtenuG(26,26) = 2,62447555 par exc`es.

Cela ne donne pas d’argument pour savoir si G(n, n) a une limite pour n grand. Le tableau de calcul, qui fournit

G(23,23) = 2,4663 ;G(24,24) = 2,5200 ;G(25,25) = 2,5727 ;

ne donne pas d’indice d’une convergence rapide ; un comportement de crois- sance ind´efinie comme une puissance de nanalogue `a √

nn’est pas exclu.

Une strat´egie d’une autre nature, dont le comportement `a l’infini est plus facile `a cerner, consiste `a lier l’arrˆet du tirage `a l’atteinte d’un objectif de gain G fix´e `a l’avance. Un raisonnement classique (principe du miroir, de D´esir´e Andr´e) conduit `a la probabilit´e de r´eussite P = CR+NR−G/CR+NR et `a l’esp´erance de gainP G, que le choix deGdoit optimiser.

Pour R =N =n, le choix optimal de G dans cette strat´egie est voisin de pn/2 etP est voisin de 1/√

e. Si n= 26, le meilleur choix est G= 4 et il donne pour esp´erance 11960/5481 = 2,18208. . ., ce qui confirme le caract`ere sous-optimal de ce type de strat´egie.

Accessoirement, on en conclut quepn/2eest un minorant de l’esp´erance de gain pour la strat´egie optimale.

2

Références

Documents relatifs

C’est le cas, par exemple, si nous ´ etudions le volume Y occup´ e par un gaz en fonction temps X , temps ´ egal ` a 0 au moment o` u nous avons actionn´ e un vaporisateur contenant

On se place dans la base des vecteurs propres de J z.. On suppose que cette mesure a donn´e le r´esultat

Le joueur en premier qui joue 5 pourra atteindre 13 au coup suivant, que son adversaire ait r´ epondu par 7 ou par 11, et ainsi de suite, jusqu’` a ce que son adversaire joue un

Equivalence et pr´ epond´ erance.

Dans un polynˆ ome de Taylor (´ ecrit dans le bon sens !), chaque terme (non nul) est pr´ epond´ erant devant

Equivalence et pr´ epond´ erance.

G´ erer les conflits entre dominants:. Ici x est un r´ eel tendant vers

G´ erer les conflits entre dominants:. Ici x est un r´ eel tendant vers