TP 5. STATISTIQUES UNIVARIEES
Définition 1.
1. Une population d’individus est un ensemble Ω ={ω1, ..., ωn}. 2. L’effectif de la population est donc Card(Ω).
3. Un caractère quantitatif est une application X : Ω−→R.
4. L’ensemble des valeurs prises parX est une série statistique.
On la note toujours (abusivement)X.
On a X ={X(ω1), ..., X(ωn)}, noté plus simplement X ={x1, ..., xn}. 5. L’étendue deXest l’écart entre la plus grande valeur de la série et la plus petite.
6. Le mode est la valeur (ou la classe de valeurs) la plus souvent prise.
7. La médiane de la population sépare la série ordonnée en deux populations de même effectif.
8. Le premier quartile q1 de la série est la plus petite valeur de la série telle qu’au moins un quart des valeurs de la série lui sont inférieures ou égales.
9. Le troisième quartileq3de la série est la plus petite valeur de la série telle qu’au moins les trois quarts des valeurs de la série lui sont inférieures ou égales.
10. La moyenne empirique de la sérieX est x= 1 n
n
X
i=1
xi .
11. La variance empirique de la sérieXest σ2(X) = 1 n
n
X
i=1
(xi−x)2 .
12. L’écart-type empirique de la sérieXest σ(X) =p σ2(X).
Exercice I.
Exécuter les programmes suivants, et expliquer l’effet des commandes utilisées : a.
x=[1,5,3,7,3,7,1,3,7,7,1,7,3]
v=linspace(0,8,5) disp(v)
[num,nbre]=dsearch(x,v) disp(num)
disp(nbre)
b.
x=[1,5,3,7,3,7,1,3,7,7,1,7,3]
M=tabul(x) disp(M)
bar(M( :,1),M( :,2))
c.
x=[1,5,3,7,3,7,1,3,7,7,1,7,3]
M=tabul(x) disp(M) pie(M( :,2))
d.
x=[1,5,3,7,3,7,1,3,7,7,1,7,3]
a=find(x>4) disp(a) b=sum(x==3) disp(b)
e.
x=[1,2,3,4,5,6,7,8]
disp(max(x)) disp(min(x)) disp(mean(x)) disp(variance(x)) disp(stdev(x)) disp(median(x)) disp(quart(x))
f.
x=[1,2,3,4,5,6,7,8,9]
disp(max(x)) disp(min(x)) disp(mean(x)) disp(variance(x)) disp(stdev(x)) disp(median(x)) disp(quart(x))
ECE 2 1 / 2 Lycée François Couperin
TP 5. STATISTIQUES UNIVARIEES
Exercice II.
1. Simuler un échantillon de 100000 réalisations de la loiN(0; 1). (On utiliseraX=grand(...’nor’...)).
2. Compléter le programme avec la séquence suivante, et expliquer son action : v=linspace(-5,5,50)
histplot(v,X)
3. Déterminer la moyenne, l’étendue, la médiane, les quartiles, le mode de la série statistique X. (On utilisera les commandesmean,max,min,median,quart.)
4. Rajouter la séquence supplémentaire, et expliquer son effet : y=gsort(x,’g’,’i’)
disp(y) disp(y(9750)) disp(y(2500))
5. Reprendre les questions précédentes en prenant cette fois une loiN(m, σ2), paramètres au choix.
Exercice III.
1. Dans un programme, créer une fonctionf : la densité gaussienne définie par f(x) = 1
√2πe− x2
2 . 2. On rappelle que la fonction de répartitionF defest définie par F(x) =P(X ≤x) =
Z x
−∞
f(t)dt. On rappelle aussi (méthode des rectangles) que
Z b
a
f(t)dt= lim
n→+∞
b−a n
n−1
X
k=0
f
a+kb−a n
! . Compléter le programme en créant la fonctionF.
3. Tracer le graphe deF.
Exercice IV.
Exécuter le programme suivant, et com- prendre ce qu’il permet d’afficher, à la fois dans la console, et au niveau graphique :
n=100000 m=10
x=grand(n,1,’nor’,0,1) y=floor(m*x)/m disp(y)
z=tabul(y,’i’) disp(z)
z( :,2)=cumsum(z( :,2))/n disp(z)
clf()
plot(z( :,1),z( :,2))
Exercice V.
Reprendre l’exercice II. dans le cas des lois suivantes : 1. U([[1,6]]) 2. B(5,0.3) 3. P(3) 4. G
1 6
5. U([3,7]) 6. E(1)
Exercice VI.
On considère l’expérience suivante.
On lance plusieurs fois successivement un dé classique équilibré à 6 faces jusqu’à ce que l’on obtienne deux6consécutifs.
On noteXle nombre de coups nécessaires.
1. Créer une fonction "double_six" qui simule cette expérience.
2. Construire un gros échantillon de réalisations de l’expérience.
(On stockera les résultats dans un vecteur, par concaténation.) 3. Tracer l’histogramme associé.
4. Calculer les différents indicateurs (cf. ex II.)
ECE 2 2 / 2 Lycée François Couperin