Chapitre 6: Mod`eles de distributions fr´equents

(1)

Chapitre 6: Mod` eles de distributions fr´ equents

1. Mod`eles discrets

(a) Distribution binomiale (b) Distribution de Poisson 2. Mod`eles continus

(a) Distribution normale (b) Distribution uniforme

(c) Distribution χ

²

(d) Distribution t

(2)

On présente dans ce chapitre les modèles de distributions les plus fréquemment utilisés comme descriptions approximatives de distributions réelles. La distribution binomiale et la distribution normale sont particulièrement importantes.

1. Mod`eles discrets

(a) Distribution binomiale

Considérons une expérience qui n’a que deux issues possibles (ex: jet d’une pièce), et convenons d’appeler S la première issue (“succès”) et E la seconde (“échec”). Considérons

`

a présent n répétitions indépendantes de cette expérience et définissons la variable aléatoire X = “nombre de succès parmi les n répétitions”. La variable X a (ou suit) une distribution binomiale.

→ De quoi va d´ependre la distribution de X?

→ → Du nombre de r´ep´etitions n

→ → De la probabilité p de succès à chaque répétition

→ On utilise la notation X ∼ B(n, p).

On dit aussi que la variable X est une variable binomiale.

(3)

1. Mod`eles discrets

(a) Distribution binomiale

`

On dit aussi que la X est une variable binomiale.

(4)

1. Mod`eles discrets

(a) Distribution binomiale

`

(5)

1. Mod`eles discrets

(a) Distribution binomiale

`

(6)

1. Mod`eles discrets

(a) Distribution binomiale

`

On dit aussi que la variable X est une variable binomiale.

(7)

Quelle est la distribution de X?

→ Si n = 1, les issues possibles sont {E} et {S} et on a

P(X = 0) = 1 − p; P(X = 1) = p.

→ Si n = 2, les issues possibles sont {EE}, {ES}, {SE} et {SS} et on a P(X = 0) = (1 − p)²; P(X = 1) = 2p(1 − p); P(X = 2) = p².

→ Cas g´en´eral:

La distribution de X ∼ B(n, p) est donn´ee par P(X = k) = n

k

p^k(1 − p)^n−k,

o`u le coefficient binomial est d´efini comme

n

k

= n!

k!(n − k)!,

et n! = 1 · 2 · ... · n (n factoriel). Par convention, 0! = 1. n k

est égal au nombre d’échantillons différents de taille k dans une population de taille n.

Un exemple détaillé de la fa¸con de parvenir à ce résultat se trouve dans la série d’exercices du chapitre 5.

(8)

P(X = 0) = 1 − p; P(X = 1) = p.

k

p^k(1 − p)^n−k,

n

k

= n!

k!(n − k)!,

(9)

P(X = 0) = 1 − p; P(X = 1) = p.

k

p^k(1 − p)^n−k,

n

k

= n!

k!(n − k)!,

(10)

P(X = 0) = 1 − p; P(X = 1) = p.

k

p^k(1 − p)^n−k, o`u le coefficient binomial est d´efini comme

n k

= n!

k!(n − k)!,

(11)

Que valent l’esp´erance et la variance de X ∼ B(n, p)?

→ Cas n = 1:

• E(X) = 0 · (1 − p) + 1 · p = p

• E(X²) = 0² · (1 − p) + 1² · p = p

→ var(X) = E(X²) − E(X)² = p − p² = p(1 − p)

Plutôt que de faire le calcul en appliquant la définition comme ci-dessus, ce qui devient très long lorsque n devient grand, constatons que X ∼ B(n, p) est la somme de n variables indépendantes X_i telles que X_i ∼ B(1, p). En effet, compter le nombre de succès dans n répétitions d’une expérience revient à attribuer “1” à chaque succès et

“0” à chaque échec et à additionner les résultats des expériences.

(12)

→ Cas n = 1:

• E(X) = 0 · (1 − p) + 1 · p = p

• E(X²) = 0² · (1 − p) + 1² · p = p

→ var(X) = E(X²) − E(X)² = p − p² = p(1 − p)

(13)

→ Cas n = 1:

• E(X) = 0 · (1 − p) + 1 · p = p

• E(X²) = 0² · (1 − p) + 1² · p = p

→ var(X) = E(X²) − E(X)² = p − p² = p(1 − p)

(14)

Donc,

X = X₁ + ... + X_n, X_i ∼ B(1, p)

En appliquant les propriétés de l’espérance et de la variance (chapitre 5), nous obtenons E(X) =

n X

i=0

E(X_i) = np

car l’espérance d’une somme est égale à la somme des espérances, et var(X) =

n X

i=0

var(X_i) = np(1 − p)

car la variance d’une somme de variables indépendantes est égale à la somme de leurs variances.

Terminologie et notation

– Une variable qui suit une distribution binomiale avec n = 1 est appel´ee une variable de Bernoulli.

– Souvent, on utilise la notation q = 1 − p, par exemple var(X) = npq pour

(15)

(b) Distribution de Poisson

Une variable X suit une distribution de Poisson de param`etre λ, ce qu’on note X ∼ P(λ), si

P(X = k) = λ^k

k! e^−λ, k = 0,1,2, ....

Les modalit´es d’une variable Poisson sont donc tous les entiers positifs plus 0.

La distribution de Poisson est un cas limite de la distribution binomiale, lorsque n devient tr`es grand et p tr`es petit. En effet, on peut montrer que pour Y ∼ B(n, p), si n → ∞, p → 0 et np = λ (np reste constant),

P(Y = k) = n k

p^k(1 − p)^n−k → λ^k

k! e^−λ. Propri´et´es

→ L’esp´erance et la variance d’une variable X ∼ P(λ) sont donn´ees par

• E(X) = λ

• var(X) = λ

→ Additivité: soient X₁, X₂, ..., X_n des variables indépendantes distribuées selon P(1). Alors

(16)

Exemple:“Tant va la cruche `a l’eau qu’enfin elle se brise”.

On remplit n = 1000 cruches au même endroit d’une rivière. On fait l’hypothèse que la probabilité qu’une cruche se brise pendant l’opération est p = 1/1000. Quelle est la probabilité qu’au moins deux cruches se brisent?

→ Le nombre X de cruches bris´ees suit une distribution B(n, p). On trouve donc P(X ≥ 2) = 1 − P(X = 0) − P(X = 1)

= 1 − 1000 0

(0.999)¹⁰⁰⁰ − 1000 1

(0.999)⁹⁹⁹ · 0.001

= 0.264.

→ L’évaluation de l’expression ci-dessus avec une calculatrice peut poser problème au niveau de la précision. En utilisant l’approximation X ∼ P(np) = P(1), on trouve

P(X ≥ 2) = 1 − P(X = 0) − P(X = 1)

≈ 1 − 1⁰

0! e⁻¹ − 1¹

1! e⁻¹

= 0.264.

(17)

Les distributions B(1000,0.001) et P(1) sont représentées ci-dessous, et on voit qu’elles sont extrêmement similaires.

0 1 2 3 4 5 6

0.00.10.20.3

X ~ B(1000,0.001)

x

P(X=x)

0 1 2 3 4 5 6

0.00.10.20.3

X ~ P(1)

x

P(X=x)

(18)

Dans la pratique la distribution de Poisson est souvent utilisée pour modéliser des données de comptage, par exemple le nombre de nouveaux cas de cancer dans une certaine région pendant une certaine période de temps (en épidémiologie on appelle ce nombre l’incidence).

Le fait que la distribution de Poisson soit souvent appropriée pour modéliser ce type de données peut se comprendre de la fa¸con suivante: pour un individu donné, la probabilité de développer un cancer est faible, mais en considérant une grande population, et en considérant chaque individu comme une “tentative”, on se retrouve en présence d’un phénomène où le nombre de “tentatives” est très élevé et la probabilité de “succès” est très faible, ce qui donne lieu à une distribution de Poisson.

(19)

1. Mod`eles continus

(a) Distribution normale

C’est la distribution la plus importante en statistique, pour deux raisons principales:

• De nombreux phénomènes naturels sont modélisables avec des variables normales

• La distribution normale joue un rˆole central dans le domaine de l’inf´erence, comme nous le verrons dans les derniers chapitres de ce cours.

On dit qu’une variable X a une distribution normale, ou gaussienne, ou de Gauss d’espérance µ et de variance σ² si sa densité est égale à

f(x) = 1 σ√

2π exp − (x − µ)² 2σ²

!

.

On ´ecrit alors X ∼ N(µ, σ²).

Terminologie: On dit aussi “de moyenne µ” à la place de “d’espérance µ”(comme on l’a vu, l’espérance est une moyenne de population).

(20)

Dans le graphe ci-dessous on trouve

• en rouge la densit´e d’une variable X ∼ N(µ₁, σ₁²)

• en vert la densit´e d’une variable Y ∼ N(µ₂, σ₂²), avec µ₂ > µ₁ et σ₂ < σ₁

f

_X

Propri´et´es valables pour toute variable normale:

• f_X est sym´etrique autour de µ₁

• P(µ₁ − 2σ₁ < X < µ₁ + 2σ₁) ≈ 0.95

• f_Y est sym´etrique autour de µ₂

(21)

µ1

f

_X

• P(µ₁ − 2σ₁ < X < µ₁ + 2σ₁) ≈ 0.95

(22)

µ1

µ1 − 2σ1 µ1 + 2σ1

f

_X

≈ 0.95

• P(µ₁ − 2σ₁ < X < µ₁ + 2σ₁) ≈ 0.95

(23)

µ1

µ1 − 2σ1 µ1 + 2σ1

f

_X

≈ 0.95

f

_Y

• P(µ₁ − 2σ₁ < X < µ₁ + 2σ₁) ≈ 0.95

(24)

µ1

µ1 − 2σ1 µ1 + 2σ1

f

_X

≈ 0.95

µ2

f

_Y

• P(µ₁ − 2σ₁ < X < µ₁ + 2σ₁) ≈ 0.95

(25)

µ1

µ1 − 2σ1 µ1 + 2σ1

f

_X

≈ 0.95

µ2

µ2 − 2σ2 µ2 + 2σ2

f

_Y

• P(µ₁ − 2σ₁ < X < µ₁ + 2σ₁) ≈ 0.95

(26)

Distribution normale standard

Une variable X ∼ N(0,1) i.e. une variable normale de moyenne 0 et de variance 1 est appelée une variable normale standard ou centrée et réduite. La densité d’une variable normale standard est communément désignée à l’aide du symbole ϕ(x). D’après la formule de la slide 19, on a

ϕ(x) = 1

√2π exp − x² 2

!

.

La fonction de distribution cumulative d’une normale standard est communément désignée à l’aide du symbole Φ(x) et définie comme

Φ(x) = 1

√2π

Z _x

−∞ exp − t² 2

!

dt.

Les valeurs de Φ(x) s’obtiennent `a l’aide d’un logiciel ou de tables.

Standardisation

Soit X ∼ N(µ, σ²). Alors la variable Z d´efinie comme Z = X − µ

σ a une distribution normale standard.

L’op´eration ci-dessus s’appelle la standardisation.

(27)

Exemple de probl`eme

Soit X ∼ N(17,9). Quelle est la probabilité que X prenne une valeur inférieure à 11?

Pour résoudre ce problème à l’aide d’une table de valeurs de Φ, on va se servir de la standardisation:

P(X > 11) = P X − 17

√9 < 11 − 17√ 9

!

= P(Z < −2)

= Φ(−2), o`u Z ∼ N(0,1).

La table ne donne la valeur de Φ(x) que pour des valeurs de x sup´erieures `a 0.

(28)

On se sert donc de la sym´etrie de la densit´e normale pour trouver:

Φ(−2) = P(Z < −2)=P(Z > 2) = 1 − P(Z < 2) = 1 − Φ(2).

0

ϕ

−2

Dans la table, on trouve Φ(2) = 0.9772 et on ontient donc Φ(−2) = 1 − 0.9772 = 0.0228.

(29)

Φ(−2) = P(Z < −2)=P(Z > 2)= 1 − P(Z < 2) = 1 − Φ(2).

0

ϕ

−2 2

(30)

Φ(−2) = P(Z < −2)=P(Z > 2)= 1 − P(Z < 2) = 1 − Φ(2).

0

ϕ

−2 2

(31)

(b) Distribution uniforme

Soient a et b des constantes. Une variable dont la densit´e f est donn´ee par f(x) =





 1

b−a si x ∈ [a, b]

0 sinon

est dite uniforme entre a et b.

0

1 b−a

a b

f(x)

x

L’esp´erance et la variance d’une variable X uniforme entre a et b sont E(X) = ^a+b₂ et var(X) = ^(b−a)².

(32)

(c) Distribution χ ² (écrit “chi carré”, prononcé“ki carré”)

Soient X₁, ..., X_n des variables normales standard. Soit alors Y = X₁² + ... + X_n².

La variable Y a une distribution χ² à n degrés de liberté, ce qu’on note Y ∼ χ²_n. Sa densité f(y) est une fonction assez compliquée et sa fonction de distribution cumulative s’obtient à l’aide d’un logiciel ou de tables. L’espérance et la variance de Y sont E(Y ) = n et var(Y ) = 2n.

00.20.40.60.81

0 1 2 3 4 5 6 7 8

f(y)

y n = 1

n = 2 n = 3 n = 4 n = 5

La distribution χ² s’utilise dans certains procédés d’inférence que nous verrons dans les chapitres à venir.

(33)

(d) Distribution t

Soient X₀, X₁, ..., X_n des variables normales standard. Soit alors

T = X₀

r1 n

X₁² + ... + X_n² .

La variable T a une distribution t à n degrés de liberté, ce qu’on note T ∼ t_n. Sa densité f(t) est une fonction assez compliquée et sa fonction de distribution cumulative s’obtient

`

a l’aide d’un logiciel ou de tables. L’esp´erance et la variance de T sont E(T) = 0 et var(T) = n/(n − 2), pour n > 2.

−4 −2 0 2 4

0.00.10.20.30.4

Distribution t

t

densité

t₁ t2

t₅ t10

t₂₀ t30

N(0,1)

(34)

Propri´et´es

• La distribution t est sym´etrique autour de 0

• lorsque n → ∞, la densit´e d’une variable T ∼ t_n tend vers une densit´e normale standard

• La distribution t est utilisée dans certains procédés d’inférence que nous verrons dans les chapitres à venir.

Chapitre 6: Mod`eles de distributions fr´equents