• Aucun résultat trouvé

Solutions des exercices du Chapitre 2

N/A
N/A
Protected

Academic year: 2022

Partager "Solutions des exercices du Chapitre 2"

Copied!
3
0
0

Texte intégral

(1)

Solutions des exercices du Chapitre 2

2.1 SoitX le vecteur `am= 20 composantes contenant les mesures `a faible niveau prot´eique et Y le vecteur `a n= 17 composantes contenant les mesures `a niveau prot´eique ´elev´e.

(a) On pose α = 0.25 etβ = 0.75 et on obtient:

• m(X) = 0.454, med(X) = 0.750, s(X) = 2.805,

• mα= 5, [⌈mα⌉] = 5, [⌊mα+ 1⌋] = 6 et donc

qα(X) = (x[5]+x[6])/2 = (−0.50−0.25)/2 =−0.375,

• mβ = 15, [⌈mβ⌉] = 15, [⌊mβ+ 1⌋] = 16 et donc

qβ(X) = (x[15]+x[16])/2 = (1.27 + 1.50)/2 = 1.385,

• Iq(X) =qβ(X)−qα(X) = 1.76

⋆ n(Y) = 0.273, med(Y) = 0.750,s(Y) = 2.007,

⋆ nα= 4.25, [⌈nα⌉] = 5, [⌊nα+ 1⌋] = 5 et donc

qα(Y) = (y[5]+y[5])/2 =y[5] =−0.50,

⋆ nβ = 12.75, [⌈nβ⌉] = 13, [⌊nβ+ 1⌋] = 13 et donc

qβ(Y) = (y[13]+y[13])/2 =y[13]= 1.25,

⋆ Iq(Y) =qβ(Y)−qα(Y) = 1.75

(b) m(X) > m(Y), mais les m´edianes sont identiques. On ne peut pas conclure que ces r´esultats soutiennent l’hypot`ese.

(c) Apr`es suppression de la donn´ee 9.00 dans X, on obtient:

• m(X) = 0.004, med(X) = 0.750, s(X) = 2.058,

• mα= 4.75, [⌈mα⌉] = 5, [⌊mα+ 1⌋] = 5 et donc

qα(X) = (x[5]+x[5])/2 =x[5] =−0.5,

• mβ= 14.25, [⌈mβ⌉] = 15, [⌊mβ+ 1⌋] = 15 et donc

qβ(X) = (x[15]+x[15])/2 =x[15] = 1.27,

• Iq(X) =qβ(X)−qα(X) = 1.77

On remarque que m(X) et s(X) changent de fa¸con importante, tandis que med(X) et Iq(X) sont presque insensibles `a la suppression de la mesure extrˆeme.

(2)

2.2 Soit N le nombre d’´etamines. Apr`es ´elimination de la plus petite valeur dans les deux ensembles de donn´ees on obtient:

(a) m(N) = 659.32, med(N) = 422, m(log(N)) = 6.056, med(log(N)) = 6.045.

(b) La m´ediane repr´esente le milieu de la distribution; la moyenne est infuenc´ee par les valeurs extrˆemes (en particulier par les valeurs ´elev´ees de N). La moyenne et la m´ediane de N sont tr`es diff´erentes car la distribution de N est tr`es asym´etrique. La m´ediane et la moyenne de log(N) sont tr`es proches, car la distribution de log(N) est presque sym´etrique.

(c) On observe que log(med(N)) = 6.045 = med(log(N)).

Ceci s’explique de la fa¸con suivante. Soient n[1] ≤. . .≤n[99] les valeurs ordonn´ees de N. Donc med(N) =n[50] et log(med(N)) = log(n[50]). En outre, comme log est une fonction monotone croissante, les valeurs ordonn´ees de log(N) sont log(n[1]) ≤. . . ≤ log(n[99]). Donc med(log(N)) = log(n[50]) = log(med(N)).

Avec toutes les donn´ees (100), on obtient med(log(N)) = 6.030581 ≈ 6.030685 = log(med(N)). Il n’y a pas une parfaite ´egalit´e car

med(log(N)) = [log(n[50]) + log(n[51])]/26= log[(n[50]+n[51])/2].

(d) ´Evidemment, la propri´et´e de la m´ediane que l’on vient d’´etablir s’´etend `a tout quantile (de fa¸con approximative ou exacte selon le cas et la d´efinition).

(e) On peut ´etendre les propri´et´es susmentionn´ees `a d’autres transformations, pourvu qu’elles soient monotones croissantes. (Que se passe-t-il pour des transformations d´ecroissantes ?) La propri´et´e ne vaut pas pour des transformations non monotones:

par exemple, med(sin(N)) =−0.184726= 0.85554 = sin(med(N)).

(f) On am(log(N)) = 6.056395<6.419214 = log(m(N)). La propri´et´e ne vaut pas pour la moyenne.

2.3 Les boxplots sont donn´es ci-dessous. La transformation logarithmique rend la distri- bution presque sym´etrique.

010002000300040005000

Boxplot of N

45678

Boxplot of log(N)

(3)

2.4 Propri´et´es de la moyenne.

(a) est ´evident.

(b) m(aX) = (ax1+. . .+axn)/n=a(x1+. . .+xn)/n=am(X).

(c) m(X+a) = (x1+a+. . .+xn+a)/n= (x1+. . .+xn+na)/n= (x1+. . .+xn)/n+na/n= m(X) +a.

(d) m(X+Y) = (x1+y1+. . .+xn+yn)/n= (x1+. . .+xn+y1+. . . yn)/n=m(X)+m(Y).

En utilisant cette propri´et´e, ainsi que (b) et (c), on obtient:

m(aX +bY +c) =m(aX) +m(bY) +c=am(X) +bm(Y) +c.

(e) Il suffit de donner un contrexemple. Soit X = (1,9) et Y = (2,0). Donc m(X) = 5, m(Y) = 1 et m(X)m(Y) = 5. D’autre part, XY = (2,0) etm(XY) = 1.

2.5 Pour d´emontrer les propri´et´es de la variance et de l’´ecart type on utilise les d´efinitions et les propri´et´es de la moyenne.

(a) On a m(c) =c. Donc, s2(c) =m([c−m(c)]2) =m(02) = 0.

(b) s2(aX +b) =m([aX +b−m(aX +b)]2) =m([aX +b−am(X)−b]2)

=m([aX −am(X)]2) =a2m([X−m(X)])2 =a2s2(X).

(c) En prenant la racine carr´ee de s2(aX +b) =a2s2(X) on obtient s(aX +b) =as(X).

(d) Il suffit de donner un contrexemple. Soit X = (1,2) etY = (1,2). Doncs2(X) = 0.52 et s2(Y) = 0.52. D’autre part, X+Y = (2,4) et s2(X +Y) = 16= 0.52+ 0.52. (e) P

(xi−m(X)) =P

xi−nm(X) =nm(X)−nm(X) = 0.

(f) s2(X) =m([X−m(X)]2) =m(X2−2Xm(X) +m(X)2)

=m(X2)−2m(X)m(X) +m(X)2=m(X2)−m(X)2.

Références

Documents relatifs

Dans la section 1.2.1, nous avons introduit les exponentielles en remarquant que pour une augmentation d’une unité de la variable, la valeur renvoyée par fonction exponentielle

• • Présenter la démarche ayant conduite Présenter la démarche ayant conduite au choix du plan d’essai expérimental au choix du plan d’essai expérimental1. • •

[r]

S2 + S3 est un mélange de solution d’acide fort S2 et d’acide faible S3... C’est une

In this paper, we answer negatively to this question by exhibiting a threshold on the doubling dimension, above which an infinite family of Cayley graphs cannot be augmented to

Our negative result requires to prove that for an infinite family of graphs in G δ , any distribution of the long range links leaves the expected number of steps of greedy routing

Montrer que cet estimateur est fortement consistant. Sans faire de calcul, montrer que ces estimateurs sont biais´ es.. d) Calculer la fonction de r´ epartition de

[r]