• Aucun résultat trouvé

G´ en´ eration de nombres issus d’une loi donn´ ee

Dans le document Statistique La théorie et ses applications (Page 78-84)

⎪⎩

Γ(α+β+ 2)

Γ(α+ 1)Γ(β+ 1)xα(1−x)β six∈]0; 1[

0 six /∈]0; 1[

avecα >−1 etβ >−1.

Pourα=β = 0 on a la loi uniformeU[0,1]. Pourαetβstrictement positifs elle admet un mode enx=α/(α+β).

Sachant que, pour toutα >−1 et tout β >−1, on a : 1

0

xα(1−x)βdx=Γ(α+ 1)Γ(β+ 1) Γ(α+β+ 2) , on calcule ais´ement, pourX;Beta(α, β) :

E(X) = α+ 1 α+β+ 2

V(X) = (α+ 1)(β+ 1) (α+β+ 2)2(α+β+ 3).

4.3 en´ eration de nombres issus d’une loi donn´ ee

Il n’est pas toujours possible d’´etudier de fa¸con analytique le comporte-ment de mod`eles, d’estimateurs ou de statistiques de tests en raison de leur complexit´e. Dans ce cas on recourt `a des simulations d’´echantillons pour suppl´eer `a l’absence d’´el´ements th´eoriques et nous nous r´ef`ererons parfois, dans les chapitres ult´erieurs, `a des r´esultats obtenus de cette fa¸con. Cette approche constitue l’essence de la m´ethode de Monte-Carlo.

Tous les logiciels offrant des possibilit´es de calcul disposent d’un g´en´erateur de«nombres au hasard»(fonction RANDOM, ALEA, etc., voir section 4.2.1) qui correspondent `a des observations issues d’une loi U[0,1] ou que l’on peut consid´erer comme telles. Car, en r´ealit´e, ces nombres que l’on qualifie plutˆot de pseudo-al´eatoires, sont engendr´es par un m´ecanisme purement d´eterministe.

Supposons que l’on veuille g´en´erer des r´ealisations d’une loi continue de fonction de r´epartitionF strictement croissante et que l’on dispose de la fonc-tion inverse F−1, soit de fa¸con analytique, soit de fa¸con num´erique (de nom-breux logiciels statistiques ou autres proposent, par exemple, les fonctions

«Gauss-inverse»,«exponentielle-inverse», etc.). ´Etant donn´e une variable al´ ea-toire U de loi U[0,1], consid´erons la fonction X =F−1(U) et d´eterminons sa fonction de r´epartition en appliquant la m´ethode de la section 1.6. On a :

P(X ≤x) =P(F−1(U)≤x)

=P(U ≤F(x)) =F(x)

puisque, pour la loi uniforme, P(U ≤u) =u.DoncX suit la loiF.

Ainsi, `a partir d’une suite de nombres au hasardu1, u2,· · · , un on peut ob-tenir une suite de nombresx1, x2,· · ·, xnissus de la loiF, par la transformation xi=F−1(ui).

Pour la loiE(λ), par exemple, F(x) = 1−e−λx et la fonction inverse est explicite : F−1(x) = −1λln(1−x). On utilisera alors la transformation xi =

1λln(1−ui).

Pour une loi discr`ete la m´ethode ci-dessus n’est pas applicable du fait queF,

´

etant une fonction en escalier, n’est pas inversible. Dans le cas o`u le nombre de valeurs possiblesa1< a2<· · ·< ak <· · ·< ar est restreint on peut l’adapter de la fa¸con suivante :

si ui∈[0, F(a1)[ alors g´en´erer xi =a1

· · ·

si ui∈[F(ak−1), F(ak)[ alors g´en´erer xi =ak

· · ·

si ui∈[F(ar−1),1] alors g´en´erer xi=ar,

le choix d’ouvrir ou de fermer chaque intervalle d’un cˆot´e ou de l’autre n’ayant pas d’importance si les ui sont g´en´er´es avec suffisamment de d´ecimales.

En particulier on peut produire un processus de Bernoulli de param`etrep en donnant la valeur 1 siui< pet 0 siui≥p.

Il existe toutefois des m´ethodes de g´en´eration adapt´ees et plus efficaces pour chaque loi que l’on trouvera dans les ouvrages consacr´es sp´ecifiquement `a la simulation.

4.4 Exercices

Exercice 4.1 En transformant lin´eairement la v.a. de la marche al´eatoire (voir exercices du chapitre 3) en une v.a. de Bernoulli, ´etablir la loi de cette marche al´eatoire apr`esnpas.

Exercice 4.2 Montrer directement que la fonction g´en´eratrice des moments Ψ(t) de la loi binomiale n´egative est pr/[1−(1−p)et]r et qu’elle est d´efinie pour t <−ln(1−p).

Aide : substituer `a (1−p)xl’expression [(1−p)et]x.

En ´ecrivant que la somme des termes de la fonction de probabilit´e vaut 1 et en d´erivant terme par terme par rapport `a p,d´eduire l’expression de la moyenne de la loi.

Exercice 4.3 * (Approche historique de Moivre mettant en ´evidence la loi de Gauss) Soit X ; B(n, p), montrer que pour n → ∞, p restant fixe, la probabilit´e P(X) = x est ´equivalente `a la fonction de densit´e en x de la loi de U ;N(np, np(1−p)) ou encore `a P(x− 12 < U < x+ 12). On admettra intuitivement que les valeurs d’int´erˆet pourx(`a probabilit´es non n´egligeables) tendent vers l’infini quandn→ ∞et que, pour ces valeurs, xn →p.

On utilisera pour la d´emonstration la formule de Stirling2 : n! =√

2πe−nnn+12(1 +o(1)) soit n!∼√

2πe−nnn+12

Exercice 4.4 SoitX ;B(n, p). Montrer que sin→ ∞etp→0 de fa¸con que npreste constant, alors P(X =x) tend vers la probabilit´e correspondante de la loi de Poisson de param`etrenp.

Aide : on admettra que (n−x)!nn! x →1 quandn→ ∞.

Exercice 4.5 SoitX ;H(N, M, n). Montrer que, quand N → ∞ et MN →p (non nul),P(X =x) tend vers la probabilit´e correspondante de la loiB(n, p).

Aide : comme pour l’exercice pr´ec´edent.

Exercice 4.6 Soient X1 et X2 deux v.a. ind´ependantes de Poisson de pa-ram`etres respectifs λ1 et λ2. Montrer que la loi conditionnelle de X1 sachant X1+X2=nest une loi binomiale.

Exercice 4.7 SoitX ;G(p). D´eterminerP(X > n) et montrer que la proba-bilit´eP(X > n+k|X > n) est ind´ependante den. [Note : Ceci est `a rapprocher de la propri´e´t´e analogue de la loiE(λ).La loiG(p) peut mod´eliser la dur´ee de vie d’un syst`eme sans usure, en temps discret d’intervalles r´eguliers].

Exercice 4.8 Soit X ; U[0,1], montrer queY = (b−a)X+a suit une loi U[a, b].

Exercice 4.9 Montrer que la fonction g´en´eratrice des moments de la loi Γ(r, λ), pourr >0 non n´ecessairement entier, est Ψ(t) = [λ/(λ−t)]r. Pour quelles va-leurs det est-elle d´efinie ? En d´eduire sa moyenne et sa variance. [Rappel sur la fonction gamma d’Euler : Γ(r) =+∞

0 xr−1e−xdx avecr >0].

Exercice 4.10 En s’appuyant sur un processus de Poisson sous-jacent, d´ eter-miner pourr entier la fonction de r´epartition de la loi Γ(r, λ). En d´eduire sa densit´e.

2Dans l’expression de cette formule le terme o(1) indique une fonction qui devient egligeable devant 1 (donc qui tend vers z´ero) quandntend vers l’infini.

Exercice 4.11 SoitX ;Γ(r, λ), montrer querXsuit une loi Γ(r,λr). Montrer queλX suit une loi Γ(r,1).

Exercice 4.12 Montrer que si X suit une loi de Pareto dont le param`etre de seuilaest ´egal `a 1, alors lnX suit une loi exponentielle.

Exercice 4.13 Le temps moyen de service `a un distributeur de billets est de 30 secondes. Vous arrivez et trouvez cinq personnes en attente (la premi`ere venant juste d’acc´eder au guichet). Quelle est la probabilit´e que vous attendiez moins de 30 secondes (on supposera ˆetre en pr´esence d’un processus de Poisson) ?

Aide : on utilisera le deuxi`eme r´esultat de l’exercice 4.11 et on ´etablira une relation de r´ecurrence pourIn=1

0 xne−xdxen int´egrant par parties.

Exercice 4.14 Pour un projet de construction d’un immeuble de 20 loge-ments, on ´etudie la capacit´e n´ecessaire du parking. On note X la variable

«nombre de voitures d’un m´enage». Pour tout m´enage on admet que la pro-babilit´e d’avoir une voiture est 0,70 et celle d’avoir 2 voitures est de 0,30 (on n´eglige toute autre possibilit´e). On supposera l’ind´ependance du nombre de voitures entre les m´enages.

On poseY =X−1. Quelle est la loi deY ?

Quelle est la loi de la somme de 20 variables i.i.d. de mˆeme loi que Y ? En d´eduire la probabilit´e qu’un parking de 29 places soit suffisant pour les 20 m´enages.

Exercice 4.15 Grˆace `a une importante ´etude ´epid´emiologique on constate que la distribution des poids des individus dans une population adulte donn´ee peut ˆ

etre convenablement mod´elis´ee par une loi lognormale. Consid´erant que le poids moyen est de 70 kg et que l’´ecart-type des poids est de 12 kg r´esoudre les deux

´

equations permettant de d´eterminer les valeurs des param`etres μ et σ2 de la loi lognormale.

Lois fondamentales de l’´ echantillonnage

5.1 Ph´ enom` enes et ´ echantillons al´ eatoires

Nous entrons maintenant v´eritablement dans le domaine de la statistique en nous penchant sur l’´etude d’observations r´ep´et´ees issues d’un certain ph´enom`ene de nature al´eatoire.

Sch´ematiquement, on peut distinguer deux classes de ph´enom`enes al´ ea-toires. D’une part l’al´eatoire peut ˆetre provoqu´e exp´erimentalement comme, par exemple, dans les jeux de hasard ou dans les m´ecanismes de tirage au sort «d’individus» dans des «populations1» finies pour les sondages, pour le contrˆole de qualit´e, etc.(voir section 3.7). Dans ce contexte exp´erimental la no-tion d’exp´erience al´eatoire, point de d´epart de la mod´elisation probabiliste, a un sens tout `a fait r´eel.

D’autre part, on peut aussi recourir `a une mod´elisation al´eatoire lorsqu’on est incapable de pr´evoir avec exactitude les r´ealisations d’un ph´enom`ene. Le caract`ere al´eatoire est simplement attribu´e au ph´enom`ene pour refl´eter l’incer-titude de l’observateur par rapport `a un ensemble de r´esultats possibles, par exemple le nombre d’appels parvenant `a un standard t´el´ephonique dans une unit´e de temps, la dur´ee de vie d’un appareil, etc. Il n’y a pas ici d’exp´erience al´eatoire `a proprement parler. Toutefois il est n´ecessaire, pour l’approche sta-tistique, de pouvoir observer le ph´enom`ene de fa¸con r´ep´et´ee afin de constituer des ´echantillons.

1Nous mettons ces termes entre guillemets car ils sont `a prendre dans un sens large et non uniquement par r´ef´erence `a des populations humaines. A proprement parler les«individus» sont desunit´es statistiquesqui peuvent ˆetre les entreprises d’un secteur d’activit´e, les arbres d’une forˆet, les pi`eces d’un lot de production, etc. La population est aussi appel´eeunivers.

D´efinition 5.1 On appelle ´echantillon al´eatoire de taille n (en bref

n-´

echantillon) une suite de n variables al´eatoires ind´ependantes et de mˆeme loi (ou v.a. i.i.d). Cette loi est appel´ee laloi m`erede l’´echantillon.

Cette d´efinition appelle quelques remarques.

– Math´ematiquement la notion d’´echantillon al´eatoire est identique `a celle de v.a. i.i.d., et l’usage de ce terme ne se justifie qu’en raison du contexte de l’´echantillonnage. Sauf mention contraire, quand on parlera d’´ echan-tillon dans cet ouvrage, il s’agira implicitement d’une suite de v.a. i.i.d.

– Il sera commode d’associer `a la loi m`ere un symbole de v.a., par exemple X,len-´echantillon ´etant alors d´esign´e parX1, X2, ..., Xn. Ainsi on peut

´ecrire que pour touti= 1, ..., n,E(Xi) =E(X) qui repr´esente la moyenne de la loi m`ere.

– On parle souvent, en lieu et place de la loi m`ere, de la distribution de la population - voire mˆeme simplement de la population - en r´ef´erence

`

a un sondage. Certes ce terme est abusif car, d’une part on y confond les individus et les valeurs num´eriques observables sur ces individus et, d’autre part, il n’existe pas n´ecessairement une population r´eelle (quelle est la population des appels `a un standard, des produits d’un certain type manufactur´es par une entreprise ?). Toutefois il nous arrivera de recourir

`

a ce terme comme s’il existait une sorte depopulation virtuelle dont les observations seraient issues comme par un tirage au hasard.

– Le statut de v.a. i.i.d. exige que le ph´enom`ene soit invariant au cours des observations successives et que ces observations n’exercent aucune influence entre elles. Il s’agit bien souvent d’une profession de foi, ces conditions n’´etant g´en´eralement pas rigoureusement v´erifiables, ni rigou-reusement v´erifi´ees.

– Pour ce qui est des notations on distinguera la notion d’´echantillon al´eatoireX1, X2, ..., Xndont on peut dire qu’elle se r´ef`ere `a des r´esultats potentiels avant exp´erience ou a priori, de celle d’´echantillon r´ealis´e x1, x2, ..., xn correspondant aux valeurs observ´ees apr`es exp´erience ou a posteriori.

L’objectif de ce chapitre est d’´etudier certaines caract´eristiques de l’´ echan-tillon al´eatoire, essentiellement sa moyenne et sa variance, en relation avec celles de la loi m`ere. A priori (au sens de la remarque pr´ec´edente) une telle caract´eristique est une v.a. qui prend le nom de«statistique»dans le contexte de l’´echantillonnage, selon la d´efinition suivante.

D´efinition 5.2 Soit X1, X2, ..., Xn un n-´echantillon, on appelle statistique toute v.a. Tn=h(X1, X2, ..., Xn), fonction de X1, X2, ..., Xn.

On peut concr´etiser la loi d’une statistique (donc d’une caract´eristique, telle la moyenne de l’´echantillon) en imaginant une simulation en tr`es grand nombre

d’´echantillons de taille n, en calculant pour chacun d’eux la valeur prise par la statistique et en ´etudiant la distribution de ces valeurs. De fa¸con imag´ee on peut dire qu’il s’agit de ladistribution d’´echantillonnage de la statistique sur

«l’univers» de tous les ´echantillons possibles. Notons qu’une statistique peut ˆ

etre une fonction `a valeurs dansR,R2ouRp. En particulier les moments empi-riques ci-apr`es sont `a valeurs dansR. Les d´efinitions qui suivent se rapportent toutes `a un ´echantillon al´eatoire not´eX1, X2, ..., Xn.

Dans le document Statistique La théorie et ses applications (Page 78-84)