• Aucun résultat trouvé

XI.2 Le collectionneur

Exercice XI.2 (Le collectionneur).

Votre petit fr`ere collectionne les images des joueurs de la coupe du monde que l’on trouve dans les tablettes de chocolat. On suppose qu’il existe n ≥ 1 images diff´erentes et qu’elles sont ´equitablement r´eparties, `a raison d’une par tablette. On noteTnle plus petit nombre de tablettes qu’il faut acheter pour obtenir une image en double.

1. Donner un mod`ele probabiliste ´el´ementaire qui permette d’´etudierTn. Montrer que pourk∈ {1, . . . , n}, on a :

P(Tn> k) =

k

Y

i=1

1−i−1 n

.

2. Montrer en utilisant les fonctions de r´epartition que (Tn/√

n, n≥1) converge en loi vers une variable al´eatoire X. (On rappelle que log(1 +x) =x+O(x2) au voisinage de 0.)

3. Montrer que la loi deX poss`ede une densit´e et la calculer.

4. D´eterminer et reconnaˆıtre la loi de X2.

5. On consid`ere un groupe de k personnes. On suppose qu’il n’y a pas d’ann´ee bissextile. Donner une approximation de la probabilit´e,pk, pour que deux per-sonnes du groupe au moins aient la mˆeme date d’anniversaire. On traitera les valeurs suivantes dek:k= 20,k= 40 etk= 366.

Exercice XI.3 (Le collectionneur).

Votre petit fr`ere collectionne les images des joueurs de la coupe du monde que l’on trouve dans les tablettes de chocolat. On suppose qu’il existe n images dif-f´erentes et qu’elles sont ´equitablement r´eparties, `a raison de une par tablette.

On note Xi ∈ {1,· · · , n} le num´ero de l’image contenue dans la i-`eme tablette.

On note Nk le nombre de tablettes achet´ees pour obtenir k images diff´erentes : Nk = inf{j ≥1; Card {Xi, i≤j}=k}. Enfin, Tk = Nk−Nk1, avec la conven-tion T1 = 1, repr´esente le nombre de tablettes achet´ees pour obtenir une nouvelle image alors que l’on en poss`ede d´ej`a k−1. Le but de cet exercice est l’´etude du nombre de tablettes,Nn, `a acheter pour avoir la collection compl`ete. Ce probl`eme est connu sous le nom du probl`eme du collectionneur de coupons2 3 ou “coupon collector” en anglais.

1. Quelle loi proposez-vous pour la suite de variables al´eatoires (Xi, i∈N) ? 2. Calculer P(T2 = ℓ) pour ℓ ∈ N. En d´eduire que T2 suit une loi g´eom´etrique

dont on pr´ecisera le param`etre.

3. Montrer que pourℓ2, ℓ3 ∈N : P(T2 =ℓ2, T3 =ℓ3)

= X

1,j2,j3distincts, j1,j2,j3∈{1,...,n}

P(X1=j1,· · ·, X2 =j1, X2+1 =j2,

· · · , X2+ℓ3 ∈ {j1, j2}, X2+ℓ3+1 =j3).

4. En d´eduire que T3 suit une loi g´eom´etrique dont on pr´ecisera le param`etre.

5. V´erifier queT2 etT3 sont ind´ependants.

6. D´ecrire Tk comme premier instant de succ`es et en d´eduire sa loi.

On admet dor´enavant que les variables al´eatoires T1, T2,· · ·, Tn sont ind´epen-dantes.

7. Calculer E[Nn] et v´erifier que E[Nn] = n(log(n) +O(1)) o`u O(1) d´esigne une fonctiongtelle que supn1|g(n)| ≤M <∞.

8. Calculer Var(Nn) et en donner un ´equivalent quandn tend vers l’infini.

9. Soit ε >0. MajorerP

Nn

E[Nn] −1

> ε

.

2. P. Flajolet and R. Sedgewick.Analytic combinatorics, Symbolic Combinatorics. Cambridge University Press,http://algo.inria.fr/flajolet/Publications/books.pdf (2009).

3. D. Aldous.Probability approximations via the Poisson clumping heuristic. Springer (1989).

10. Montrer que la suite

Nn

nlogn, n∈N

converge en probabilit´e vers 1.

Exercice XI.4 (Le collectionneur).

Soit (Xk, k∈ N) une suite de variables al´eatoires ind´ependantes de loi exponen-tielle E(λ) de param`etre λ > 0. La variable al´eatoire Xi repr´esente le temps de panne de la machinei. On suppose qu’une fois en panne les machines ne sont pas r´epar´ees. Soit n ≥ 2. On note X(1) ≤ · · · ≤ X(n) le r´eordonnement croissant de X1, . . . , Xn, appel´e aussi statistique d’ordre. Ainsi X(i) repr´esente le temps de la i-`eme panne quand on consid`ere l’ensemble desnmachines. On pose

Y1=X(1) = min

1inXi,

le temps de la premi`ere panne, Y2 =X(2)−X(1) le temps entre la premi`ere et la deuxi`eme panne, et plus g´en´eralement pour k∈ {2, . . . , n},

Yk=X(k)−X(k1).

Le but de ce probl`eme est dans un premier temps d’´etudier le comportement de l’instant o`u la derni`ere machine tombe en panne, X(n) =Pn

i=1Yi, quand n tend vers l’infini. Dans un deuxi`eme temps nous ´etudierons la loi du vecteur (Y1, . . . , Yn).

Enfin nous donnerons une application de ces deux r´esultats au probl`eme du col-lectionneur dans une troisi`eme partie.

I Comportement asymptotique de X(n) =Pn i=1Yi. 1. Calculer la fonction de r´epartition de X(n)= max1inXi.

2. Montrer que la suite (X(n)−λ1logn, n∈N) converge en loi vers une variable al´eatoireZ dont on d´eterminera la fonction de r´epartition.

3. Pour λ= 1, en d´eduire la densit´ef de la loi de Z. D´eterminer, `a la premi`ere d´ecimale pr`es,aetb tels queRa

−∞f(z)dz= 2.5% et R+

b f(z)dz = 2.5%.

II Loi du vecteur (Y1, . . . , Yn).

1. Soit i6=j. Calculer P(Xi =Xj).

2. En d´eduire que P(∃i6= j;Xi =Xj) = 0. Remarquer que presque sˆurement le r´eordonnement croissant est unique, c’est-`a-dire X(1) <· · · < X(n). Ainsi p.s.

aucune machine ne tombe en panne au mˆeme instant.

3. On suppose dans cette question et la suivante seulement que n = 2.

Soit g1 et g2 des fonctions born´ees mesurables. En distinguant {X1 < X2} et {X2 < X1}, montrer que :

E[g1(Y1)g2(Y2)] = Z

g1(y1)g2(y2) 2λ2e2λy1λy21{y1>0,y2>0} dy1dy2. En d´eduire une expression deE[g1(Y1)] puis la loi de Y1.

4. D´eduire la loi de Y2 et v´erifier que Y1 et Y2 sont ind´ependants. Donner la loi du vecteur (Y1, Y2).

5. En d´ecomposant suivant les ´ev`enements {Xσ(1) <· · ·< Xσ(n)}, o`uσ parcourt l’ensembleSn des permutations de{1, . . . , n}, montrer que pourn≥3 :

E[g1(Y1)· · ·gn(Yn)] =n!E[g1(X1)g2(X2−X1)· · ·gn(Xn−Xn1)1{X1<···<Xn}], o`u les fonctions g1, . . . gn sont mesurables born´ees. On pourra utiliser, sans le justifier, le fait que les vecteurs (Xσ(1), . . . , Xσ(n)) et (X1, . . . , Xn) ont mˆeme loi.

6. Calculer la loi de Yi, i ∈ {1, . . . , n}. Montrer que les variables al´eatoires Y1, . . . , Yn sont ind´ependantes. Donner la loi du vecteur (Y1, . . . , Yn).

7. En d´eduire la fonction caract´eristique de X(n). III Application

Votre petit fr`ere collectionne les images de Pok´emons que l’on trouve dans les plaquettes de chocolat. On suppose qu’il existenimages diff´erentes et qu’elles sont r´eparties au hasard dans les plaquettes. On noteTk,nle nombre de plaquettes qu’il faut acheter pour avoir une nouvelle image, alors que l’on en poss`ede d´ej`a k−1.

On a doncT1,n = 1. Pour avoir toutes les images, il faut donc acheter T1,n+· · ·+ Tn,n=Nn plaquettes. On admet (voir l’exercice XI.3) que les variables al´eatoires T1,n, . . . , Tn,n sont ind´ependantes et que la loi de Tk,n est la loi g´eom´etrique de param`etre 1−k−1

n . On admet de plus queE[Nn]∼nlognet que Nn

nlogn converge en probabilit´e vers 1 quandn→ +∞. Le but de cette partie est de d´eterminer `a quelle vitesse a lieu cette convergence4 et d’en d´eduire un intervalle al´eatoire pour le nombre de plaquettes de chocolat que votre petit fr`ere doit acheter pour avoir sa collection compl`ete.

Soit ψk,n la fonction caract´eristique de 1

nTnk+1,n, o`u k∈ {1, . . . , n} et ψk la fonction caract´eristique de la loi exponentielle de param`etre k.

4. P. Erd¨os and A. R´enyi. On a classical problem of probability theory.Publ. Math. Inst. Hung.

Acad. Sci., Ser. A, vol. 6, pp. 215–220 (1961).

1. Montrer que la suite 1

nTnk+1,n, n≥k

converge en loi vers la loi exponen-tielle de param`etrek.

De mani`ere formelle, on a pour ngrand et des variables al´eatoires ind´ependantes : 1 al´eatoireZ d´efinie au paragraphe I.

4. Donner un intervalle al´eatoire, In, de niveau asymptotiqueα= 95% pour Nn: P(Nn∈In)≃95%) pourngrand.

5. Quel est le nombre moyen de plaquettes de chocolat que votre petit fr`ere doit acheter pour avoir la collection de n = 151 Pok´emons compl`ete. Donner un intervalle al´eatoire qui contienne avec une probabilit´e de 95% le nombre de plaquettes que votre petit fr`ere risque d’acheter pour avoir une collection com-pl`ete.

Refaire l’application num´erique pour n = 250, qui correspond au nombre de Pok´emons de la deuxi`eme ´edition.

XI.3 Le paradoxe du bus