• Aucun résultat trouvé

Chapitre II : série statistique à deux caractères

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre II : série statistique à deux caractères"

Copied!
25
0
0

Texte intégral

(1)

ENP Mr : SAHNOUN.A.Y Page 1

Chapitre II : série statistique à deux caractères

Lorsque l’on étudie plusieurs caractères simultanément, on souhaite évaluer le lien entre les caractères et leur dépendance. On parle donc de Statistique descriptive bivariée

Le but est d’étudier simultanément deux variables X et Y sur une même population.

Exemples : On veut étudier le rapport entre l’âge des femmes (ayant au moins un enfant) et le nombre de leurs enfants.

1. Les tableaux à deux caractères

Une population statistique peut être décrite à l’aide de deux caractères simultanément Les tableaux statistiques correspondant sont à deux dimensions, ils sont appelés tableaux de contingence ou croisés dynamiques ou à double entrées

Présentation générale des tableaux de contingence

Considérons une population statistique décrite par deux caractères Un caractère X dont les p modalités xi sont x1, x2, ...,xp et un

Caractère Y dont les q modalités yj sont y1, y2, ..., yq

Les q modalités deY

Les p modalités de X

x

i

y

j

y

1

Y

2

……. y

j

……… y

q

n

i. Effectifs marginaux

x

1

n

11

n

12

……. n

1j

……. n

1q

n

1.

X

2

n

21

n

22

……. n

1j

……. n

2q

X

i

n

i1

n

i2

……. n

ij

……. n

iq

n

i.

X

p

n

p1

n

p2

……. n

pj

……. n

pq

n

p.

n

.j

n

.1

n

.2

n

.j

n

.q

n

..

Effectifs marginaux

ni. : somme des effectifs de la ième ligne, l’indice j variant de 1 à q est remplacé par « . »

n.j : somme des effcetifs de la modalité yj, l’indice i=1 à p est remplacé par « . »

(2)

ENP Mr : SAHNOUN.A.Y Page 2 Propriétés des tableaux de contingence :

Les modalités xi et yj étant incompatibles et exhaustives, on peut écrire plusieurs séries d’égalités

∑ 𝑛𝑖𝑗= 𝑛𝑖.

𝑞

𝑗=1

Représente le nombre d’individus présentant la modalité xi de X quelle que soit la modalité de Y

∑ 𝑛𝑖𝑗 = 𝑛.𝑗

𝑝

𝑖=1

Représente le nombre d’individus présentant la modalité yj de Y quelle que soit la modalité de X L’effectif total de la population :

Il apparaît à l’intersection de la dernière ligne et de la dernière colonne Il est égal à la somme de la dernière ligne ou de la dernière colonne

∑ 𝑛.𝑗 = ∑ 𝑛𝑖.

𝑝

𝑖=1

= 𝑛..

𝑞

𝑗=1

En remplaçant ni. et n.j par les expressions précédentes, on obtient

∑ ∑ 𝑛𝑖𝑗= ∑ ∑ 𝑛𝑖𝑗=

𝑝

𝑖=1 𝑞

𝑗=1

𝑛..

𝑞

𝑗=1 𝑝

𝑖=1

Les fréquences partielles :

La fréquence partielle est le rapport de l’effectif partiel par l’effectif total La fréquence partielle des modalités xi , yj est égale à :

Remarque :

1.Dans la 1ère colonne les n modalités x1, x2, ..., xi, ...., xp du caractère X Dans la 1ère ligne les k modalités y1, y2, ..., yj, ...., yq du caractère Y 2. L’effectif nij correspond à l’intersection d’une ligne i et d’une colonne j L’effectif de la population présentant à la fois la modalité xi et la modalité yj 3. Pour les effectifs marginaux ni. et n.j , on remplace l’indice qui varie par « . » ni. : somme des effectifs de la ième ligne, j =1, ..., q est remplacé par « . » n.j : somme des effectifs de la jème colonne, i =1, ..., p est remplacé par « . » 4. L’effectif général marginal de X est noté « ni. » et celui de Y « n.j »

5. L’effectif total du tableau est noté « n.. » : il s’agit de l’effectif total de la population étudiée

(3)

ENP Mr : SAHNOUN.A.Y Page 3 𝑓𝑖𝑗=𝑛𝑖𝑗

𝑛..

C’est la proportion d’individus satisfaisant à la fois la modalité xi et la modalité yj

Distributions marginales :

Un tableau de contingence compte deux distributions marginales :

La distribution marginale du caractère X et la distribution marginale du caractère Y La distribution marginale du caractère X

Elle est composée des modalités du caractère X et des effectifs correspondant quelles que soit les modalités du caractère Y

La distribution marginale du caractère X est donnée par le tableau suivant

Caractère Effectifs marginaux Fréquences marginales

x1 n1. f1.

x2 n2. f2.

xi ni. fi.

xp np. fp.

total n.. 1

On peut calculer les « fréquences marginales »: rapport de l’effectif marginal sur l’effectif total 𝑓𝑖. =𝑛𝑖.

𝑛. . La distribution marginale du caractère Y :

Elle est composée des modalités du caractère Y et des effectifs correspondant quelles que soit les modalités du caractère X La fréquence marginale de la modalité yj est égale à :

𝑓.𝑗 =𝑛.𝑗 𝑛. . Remarque :

La somme des fréquences partielles est égale à 1

∑ ∑ 𝑓𝑖𝑗 = 1

𝑞

𝑗=1 𝑝

𝑖=1

(4)

ENP Mr : SAHNOUN.A.Y Page 4 Caractère Effectifs marginaux Fréquences marginales

y1 n.1 f.1

y2 n.2 f.2

yi n.i f.j

yp n.p f.q

total n.. 1

Exemple: En ne considérant que 120 familles ayant au moins une voiture et au moins un enfant, on construit un tableau de contingence ci-dessous où X représente le nombre de chambres par foyer et Y le nombre d’enfants par foyer.

Y

X 1 2 3 4

1 12 4 5 11

2 18 16 11 3

3 10 4 20 6

Calcul des effectifs : y

X 1 2 3 4 ni.

1 12 4 5 11 32

2 18 16 11 3 48

3 10 4 20 6 40

n.j 40 24 36 20 120

Les fréquences :

y X

1 2 3 4 fi.

1 10 3.3 4.1 9.1 26,67

2 15 13.33 9.1 2.5 40

3 8.3 3.33 16.66 5 33,33

f.j 33,33 20 30 16,67 100%

(5)

ENP Mr : SAHNOUN.A.Y Page 5 Distribution marginale de X:

xi ni. fi. (%)

1 32 26,67

2 48 40

3 40 33,33

total 120 100

Distribution marginale de Y:

yj n.j f.j (%)

1 40 33,33

2 24 20

3 36 30

4 20 16,67

total 120 100

Distributions conditionnelles :

1. Distributions conditionnelles du caractère X liées par yj

Ce sont les modalités de X et des effectifs de chacune de ces modalités dans la sous population présentant la modalité yj de Y.

Caractère Effectifs de yj Fréquences conditionnelles

x1 n1j f1/j

x2 n2 j f2/j

xi ni j fi/j

xp np j fp/j

total n.j 1

On peut calculer la fréquence conditionnelle de la modalité xi de X sous condition que Y=yj :

𝑓𝑥𝑖/𝑦𝑗=𝑛𝑖𝑗 𝑛.𝑗

(6)

ENP Mr : SAHNOUN.A.Y Page 6 2. Distributions conditionnelles du caractère Y liées par xi

Ce sont les modalités de Y et des effectifs de chacune de ces modalités dans la sous population présentant la modalité xi de X

Caractère Effectifs de yj Fréquences

conditionnelles

y1 ni1 f1/i

y2 ni2 F2/i

yi nij fj/i

yp nip fq/i

total ni. 1

La fréquence conditionnelle de la modalité yj de Y sous condition que x = xi 𝑓𝑦𝑗 /𝑥𝑖=𝑛𝑖𝑗

𝑛𝑖.

Exemple: Pour l’exemple précédent, la distribution de X sous la condition Y=2

xi ni2 fi2 (%)

1 4 16,67

2 16 66,67

3 4 16,67

total 24 100

La distribution de Y sous la condition X=1

yj n1j f1j (%)

1 12 37,5

2 4 12,5

3 5 15,625

4 11 34,375

total 32 100

(7)

ENP Mr : SAHNOUN.A.Y Page 7 4 Représentation graphique :

4.1 Qualitatifs Exemple :

Y

X fonctionner inactif retraité

masculin 5 3 1

féminin 4 3 4

Fig : Profils colonne en bâton

Fig : Profils colonne groupé en bâton 0

1 2 3 4 5 6

fonctionneur inactif retraité

masculin féminin

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

fonctionneur inactif retraité

féminin masculin

(8)

ENP Mr : SAHNOUN.A.Y Page 8 Fig : Profils ligne en bâton.

Fig : Profils ligne groupé en bâton

0 1 2 3 4 5 6

masculin féminin

retraité inactif fonctionneur

0% 20% 40% 60% 80% 100%

masculin féminin

fonctionneur inactif retraité

0 1 2 3 4 5

fonctionneur inactif retraité

masculin féminin

(9)

ENP Mr : SAHNOUN.A.Y Page 9 Fig : diagramme de cylindre de colonne

Fig : diagramme de cylindre en ligne

Fig : Profils plan (mur)

4.2. Quantitatifs : Discret :

Y

X 1 2 3 4

1 1 1 1 11

2 4 3 1 3

3 2 4 2 6

0 2 4 6

masculin féminin

retraité inactif fonctionneur

0%

20%

40%

60%

80%

100%

fonctionner

inactif

retraité

féminin masculin X

(10)

ENP Mr : SAHNOUN.A.Y Page 10 Fig : Profils en bulle

Fig : Profils en bulle continu :

POIDS [20,40[ [40,60[ [60,80[

[120,140[ 1 1 1

[140,160[ 6 3 1

[160,180[ 2 6 2

(11)

ENP Mr : SAHNOUN.A.Y Page 11 Fig : Profils histogramme en colonne

Fig : Profils histogramme en ligne 0

1 2 3 4 5 6 7

[20,40[ [40,60[ [60,80[

[120,140[

[140,160[

[160,180[

0 1 2 3 4 5 6 7

[120,140[

[140,160[

[160,180[

[60,80[

[40,60[

[20,40[

(12)

ENP Mr : SAHNOUN.A.Y Page 12 5. Caractéristiques numériques des distributions marginales

Soient X et Y deux caractères quantitatifs discrets.

{ xi , ni. } est la distribution marginale d’effectifs du caractère X et { yj , n.j } est la distribution marginale d’effectifs du caractère Y.

Ces deux distributions peuvent être étudiées comme dans le cas des statistiques univariées.

En particulier, elles peuvent être caractérisées par leur moyenne et variance.

La moyenne de du caractère X:

𝑥̅ = 1

𝑛 ∙∙∑ 𝑛𝑖∙

𝑝

𝑖=1

𝑥𝑖

La moyenne de du caractère Y:

𝑦̅ = 1

𝑛 ∙∙∑ 𝑛∙𝑗

𝑞

𝑗=1

𝑦𝑗

La variance du caractère X:

𝑉𝑎𝑟(𝑋) = 1

𝑛 ∙∙∑ 𝑛𝑖∙(𝑥𝑖− 𝑥̅)2

𝑝

𝑖=1

= 1

𝑛 ∙∙∑ 𝑛𝑖∙𝑥𝑖² − 𝑥̅2

𝑝

𝑖=1

La variance du caractère Y:

𝑉𝑎𝑟(𝑌) = 1

𝑛 ∙∙∑ 𝑛∙𝑗(𝑦𝑖− 𝑦̅)2

𝑞

𝑗=1

= 1

𝑛 ∙∙∑ 𝑛∙𝑗𝑦𝑖² − 𝑦̅2

𝑞

𝑗=1

Exemple :

Remarque : Dans le cas où l’un des caractères X et Y est quantitatif continu, on remplace les formules de la moyenne et de la variance les valeurs xi par les centres ci des classes du caractère

(13)

ENP Mr : SAHNOUN.A.Y Page 13 Y

X 1 2 3 4

1 12 4 5 11

2 18 16 11 3

3 10 4 20 6

La moyenne de X :

𝑥̅ = 1

120∑ 𝑛𝑖∙

3

𝑖=1

𝑥𝑖

Y

X ni. ni.* xi

1 32 32

2 48 96

3 40 120

somme 120 248

𝑥̅ = 1

120× 248 ≃ 2,07 La variance de X :

𝑉𝑎𝑟(𝑋) = 1

120∑ 𝑛𝑖∙𝑥𝑖² − 𝑥̅2

3

𝑖=1

Y

X ni. ni.* xi²

1 32 32

2 48 192

3 40 360

somme 120 584

𝑉𝑎𝑟(𝑋) = 1

120× 584 − (2,07)2≃ 0,58

Caractéristiques numériques des distributions conditionnelles :

Chacune des distributions conditionnelles peut être étudiée comme dans le cas des statistiques univariées. On peut définir les moyennes et les variances conditionnelles

La moyenne conditionnelle du caractère X sachant que Y=yj :

𝑥̅𝑗= 1

𝑛∙𝑗∑ 𝑛𝑖𝑗

𝑝

𝑖=1

𝑥𝑖

(14)

ENP Mr : SAHNOUN.A.Y Page 14 La moyenne conditionnelle du caractère Y sachant que X=xi :

𝒚

̅𝒊 = 𝟏

𝒏𝒊∙∑ 𝒏𝒊𝒋

𝒒

𝒋=𝟏

𝒚𝒋

La variance de X sachant que Y=yj

𝑉𝑎𝑟(𝑋|𝑌 = 𝑦𝑗) = 𝟏

𝒏∙𝒋∑ 𝒏𝒊𝒋(𝒙𝒊− 𝒙̅)𝟐

𝒑

𝒊=𝟏

= 𝟏

𝒏∙𝒋∑ 𝒏𝒊𝒋𝒙𝒊² − 𝒙̅𝒋𝟐

𝒑

𝒊=𝟏

La variance de Y sachant que X=xi

𝑉𝑎𝑟(𝑌|𝑋 = 𝑥𝑖) = 𝟏

𝒏𝒊∙∑ 𝒏𝒊𝒋(𝒚𝒋− 𝒚̅ )𝟐

𝒒

𝒋=𝟏

= 𝟏

𝒏𝒊∙∑ 𝒏𝒊𝒋𝒚𝒋² − 𝒚̅𝒋𝟐

𝒒

𝒋=𝟏

(15)

ENP Mr : SAHNOUN.A.Y Page 15 3. La covariance

Il s'agit de définir un indice de liaison entre les deux variables considérées. Cet indice est le coefficient de corrélation linéaire ; il nécessite la définition préalable de la covariance.

Bon ajustement

Mauvais ajustement :

Démonstration

La covariance est donc la moyenne des produits des écarts aux moyennes (dans chaque produit, chacun des deux écarts est relatif à l'une des deux variables considérées). On peut, la encore, retenir son expression sous la forme suivante : c'est la moyenne des produits moins le produit des moyennes. Comme la variance, la covariance n'a pas de signification concrète. Dans le cas de la variance, on doit passer à l'écart-type pour avoir un indicateur interprétable ; dans celui de la covariance, il faudra passer au coefficient de corrélation linéaire.

Définition :

La covariance généralise à deux variables la notion de variance. Sa formule de définition est la suivante :

𝑐𝑜𝑣(𝑥, 𝑦) = 𝑠𝑋𝑌= 1

𝑛∑ 𝒙𝒊− 𝒙̅ 𝒚𝒋− 𝒚̅

𝑛

𝑖=1

= 1 𝑛∑ 𝒙𝒊

𝑛

𝑖=1

𝒚𝒋 𝒙̅ ∙ 𝒚̅

(16)

ENP Mr : SAHNOUN.A.Y Page 16 Propriétés de la covariance :

La covariance est un indice symétrique. De façon évidente, on a SXY = SYX (les deux variables jouent donc le même rôle dans la définition de la covariance).

La covariance peut prendre toute valeur réelle (négative, nulle ou positive ; \petite" ou \grande"

en valeur absolue).

3.1.Le coefficient de corrélation linéaire : Définition :

Bon ajustement

Mauvais ajustement : Définition :

Les coefficients de corrélation permettent de donner une mesure synthétique de l’intensité de la relation entre deux caractères et de son sens lorsque cette relation est monotone.

Le coefficient de corrélation de Pearson permet d’analyser les relations linéaires : 𝑐𝑜𝑟𝑟(𝑥, 𝑦) = 𝑐𝑜𝑣(𝑋, 𝑌)

𝜎(𝑋)𝜎(𝑌)

(17)

ENP Mr : SAHNOUN.A.Y Page 17 Figure : Différents état de corrélation

Propriétés coefficient de corrélation : corr(X, Y ) € [−1, 1]

corr(X, Y ) = corr(Y,X) corr(X,X) = 1

Le coefficient de corrélation est un coefficient sans dimension. Il mesure la présence et l’intensité de la liaison linaire entre X et Y

1. corr(X, Y ) = 1 : liaison linéaire exacte Y = aX + b avec a > 0 ; 2. corr(X, Y ) = −1 : liaison linéaire exacte Y = aX + b avec a < 0 ;

3. corr(X, Y ) = 0 : non corrélation : on a indépendance possible, mais non certaine ; 4. corr(X, Y ) > 0 : liaison relative, X et Y ont tendance à varier dans le même sens ; 5. corr(X, Y ) < 0 : liaison relative, X et Y ont tendance à varier dans le sens contraire ; 6. |corr(X, Y )| > 0.9 la liaison linéaire est considérée comme forte.

(18)

ENP Mr : SAHNOUN.A.Y Page 18 Exemple :

Nous considérons 10 joueurs et soient :

– Y la variable qui représente le nombre de jeux auquel un joueur joue.

– X la variable qui représente le gain ou perte (+1 s’il gagne 10 Da et −1 s’il perd 10 Da et 0 sinon).

Nous avons le tableau de contingence suivant :

1. Compléter le tableau ci-dessus.

2. Calculer cov(X, Y ).

Solution :

Nous avons

𝑥̅ =1

𝑛∑ 𝑛𝑖∙𝑥𝑖 = 1

10(−1 × 5) + (0 × 3) + (1 × 2) = −0,3

3

𝑖=1

Et

𝑦̅ =1

𝑛∑ 𝑛∙𝑗𝑦𝑖 = 1

10(1 × 1) + (2 × 3) + (3 × 3) + (4 × 3) = 2,8

3

𝑖=1

Aussi, nous avons

𝑐𝑜𝑣(𝑋, 𝑌) = 1

𝑛∑ 𝑛𝑖𝑗𝒙𝒊

𝑛

𝑖=1

𝒚𝒋 𝒙̅ ∙ 𝒚̅

𝑐𝑜𝑣(𝑋, 𝑌) = 1

10(−1 × 0 × 1) + (−1 × 1 × 2) + (−1 × 2 × 3) + (−1 × 2 × 4) +(1 × 1 × 2) + (1 × 1 × 3) − (−0,3 × 2,8) = −0,26

On calcule l’écart-type

𝑉𝑎𝑟(𝑥) =1

𝑛∑ 𝑛𝑖∙𝑥𝑖2− 𝑥̅² = 0,61

3

𝑖=1

Alors

𝜎(𝑋) = √0,61 = 0,781 𝑉𝑎𝑟(𝑦) =1

𝑛∑ 𝑛𝑖∙𝑦𝑖2− 𝑦̅² = 80,10

3

𝑖=1

Alors

𝜎(𝑌) = √80,10 = 8,953

(19)

ENP Mr : SAHNOUN.A.Y Page 19 𝑐𝑜𝑟𝑟(𝑋, 𝑌) = −0,26

0,781 × 8,953 𝑐𝑜𝑟𝑟(𝑋, 𝑌) = −0.037 4. Ajustement :

Définition :

Soit X et Y deux variables statistiques numériques observées sur n individus. Dans un repère orthogonal (𝑂; 𝑖⃗; 𝑗⃗) , l’ensemble des n points de coordonnées (xi, yi) forme le nuage de points associé à cette série statistique.

4.2 Le problème de l’ajustement

Le nuage de points associé à une série statistique à deux variables donne donc immédiatement des informations de nature qualitatives.

Pour en tirer des informations plus quantitatives, il nous faut poser le problème de l’ajustement.

Le tracé met en évidence la possibilité de "reconnaître" graphiquement la possibilité d’une relation fonctionnelle entre les deux grandeurs observées (ici rang et nombre d’adhérent).

Le problème de l’établissement d’une relation fonctionnelle entre les deux séries est le problème de l’ajustement

4.3 Point moyen (droite de Mayer) Définition :

Soit une série statistique à deux variables, X et Y , dont les valeurs sont des couples (xi; yi). On appelle point moyen la méthode qui consiste à :

 partager le nuage en deux nuages N1 et N2 de même effectifs ou effectif différents si l’effectif total est impair

 déterminer les points moyens G1 et G2 des nuages N1 et N2

 ajuster le nuage par la droite (G1G2) appelée droite de Mayer

𝑥𝐺=𝑥1+ 𝑥2+∙∙∙ +𝑥𝑛 𝑛

𝑦𝐺 =𝑦1+ 𝑦2+∙∙∙ +𝑦𝑛 𝑛

𝑦 − 𝑦1 = 𝑎(𝑥 − 𝑥1) Avec

𝑎 = (𝑦2 − 𝑦1) /(𝑥2 − 𝑥1) Exemple :

Le tableau suivant donne l’évolution du nombre d’adhérents d’un club de Tennis de 2001 à 2006.

Année 2001 2002 2003 2004 2005 2006

Rang xi 1 2 3 4 5 6

Nombre d’adhérents 70 90 115 140 170 220

Déterminer les coordonnées des points moyens suivants : G1 des années allant de 2001 à 2003,

G2 des années allant de 2004 à 2006,

G, point moyen du nuage de points tout entier.

Solution :

(20)

ENP Mr : SAHNOUN.A.Y Page 20 Calcul des coordonnées de G1 : 𝑥𝐺1= 3 = 2

𝑦𝐺1=70 + 90 + 115

3 = 91,7

donc, G1( 2 ; 91, 7 )

Calcul des coordonnées de G2 : 𝑥𝐺2=4 + 5 + 6

3 = 5 𝑦𝐺2 =140 + 170 + 220

3 = 176,7

donc, G2( 5 ; 176, 7 )

Calcul des coordonnées de G :

𝑥𝐺 =1 + 2 + 3 + 4 + 5 + 6

6 = 3,5

𝑦𝐺 =70 + 90 + 115 + 140 + 170 + 220

6 = 134,2

donc, G( 3, 5 ; 134, 2 )

(21)

ENP Mr : SAHNOUN.A.Y Page 21 Détermination de l’équation :

G1( 2 ; 91, 7 ) G2( 5 ; 176, 7 )

Y-91,7=(176,7−91,7

5−2 ) (𝑥 − 2) Y=28,33 x + 280,02 4.3 Méthode des moindres carrés :

La loi normale ou de Laplace-Gauss est encore appelée loi des erreurs ou des écarts, car c’est ainsi qu’elle a été introduite. Le principe de la méthode des moindres carrés ordinaires (MCO) consiste à s’intéresser à la série statistique

Bon ajustement

Mauvais ajustement :

Si les observations se conformaient exactement au modèle, les n observations (𝑥𝑖, 𝑦𝑖) devraient vérifier 𝑦𝑖 = 𝑎𝑥𝑖+ 𝑏.

En fait, cela se produit rarement. Le plus souvent, il y a des écarts notés ei que l’on va introduire dans l’équation du modèle :

𝑦𝑖 = 𝑎𝑥𝑖+ 𝑏 + 𝑒𝑖

L'ajustement linéaire par la méthode des moindres carrés consiste à déterminer la droite (que l'on appelle aussi droite de régression) telle que la somme des carrés des n valeurs yi –^yi soit minimale (ce qui explique le nom de la méthode).

𝑒𝑖 = 𝑦𝑖 – 𝑦̂𝑖 Définition :

On appelle droite de régression de Y selon x, notée DY / x, déterminée par la méthode des moindres carrés, la droite d’équation y = ax + b, pour laquelle la somme des carrés des résidus est minimale.

(22)

ENP Mr : SAHNOUN.A.Y Page 22 On veut donc minimiser la quantité 𝑞 = ∑(𝑦𝑖− (𝑎𝑥𝑖+ 𝑏)) ²

Rappelons que la valeur minimale d'une fonction se calcule en posant sa dérivée égale à 0. Pour trouver a et b, calculons cette dérivée. Calculons d'abord la dérivée de q par rapport à a.

𝑑𝑞

𝑑𝑎= −2 ∑(𝑦𝑖− (𝑎𝑥𝑖+ 𝑏)) = 0

∑ 𝑥𝑖𝑦𝑖 = 𝑎 ∑ 𝑥𝑖2+ 𝑏 ∑ 𝑥𝑖… … . . (1) Calculons maintenant la dérivée de q par rapport à b.

𝑑𝑞

𝑑𝑏= −2 ∑(𝑦𝑖− 𝑎𝑥𝑖+ 𝑏) = 0

∑ 𝑦𝑖 = ∑ 𝑎𝑥𝑖 + ∑ 𝑏

∑ 𝑦𝑖 = ∑ 𝑎𝑥𝑖 + 𝑛𝑏

Divisons le tout par n

𝑦̅ = 𝑎𝑥̅ + 𝑏 𝑏 = 𝑦̅ − 𝑎𝑥̅ … . (2) Ce résultat indique que la droite passe par le point moyen (𝑥̅, 𝑦̅) . Introduisons le résultat de (2) dans (1) pour trouver a :

(23)

ENP Mr : SAHNOUN.A.Y Page 23

∑ 𝑥𝑖𝑦𝑖 = 𝑎 ∑ 𝑥𝑖2+ (𝑦̅ − 𝑎𝑥̅) ∑ 𝑥𝑖

∑ 𝑥𝑖𝑦𝑖 = 𝑎 ∑ 𝑥𝑖2+ 𝑦̅ ∑ 𝑥𝑖− 𝑎𝑥̅ ∑ 𝑥𝑖

𝑎 ∑ 𝑥𝑖2+ 𝑎𝑥̅ ∑ 𝑥𝑖 = ∑ 𝑥𝑖𝑦𝑖− 𝑦̅ ∑ 𝑥𝑖

𝑎 =∑ 𝑥𝑖𝑦𝑖− 𝑦̅ ∑ 𝑥𝑖

∑ 𝑥𝑖2+ 𝑥̅ ∑ 𝑥𝑖

𝑎 =∑ 𝑥𝑖𝑦𝑖− 𝑛𝑦̅𝑥̅

∑ 𝑥𝑖2+ 𝑛 𝑥̅² = 1

𝑛∑ 𝑥𝑖𝑦𝑖− 𝑦̅𝑥̅

1

𝑛∑ 𝑥𝑖2+ 𝑥̅²

=𝜎𝑥𝑦 𝜎𝑥2

𝐷𝑌/𝑥: 𝑦 = 𝑎𝑥 + 𝑏, 𝑎𝑣𝑒𝑐 {𝑎̂ =𝑐𝑜𝑣(𝑋, 𝑌) 𝑉(𝑋) 𝑏̂ = 𝑦̅ − 𝑎𝑥̅

𝐷𝑋/𝑦: 𝑥 = 𝑎′𝑦 + 𝑏′, 𝑎𝑣𝑒𝑐 {𝑎′̂ =𝑐𝑜𝑣(𝑋, 𝑌) 𝑉(𝑌) 𝑏′̂ = 𝑦̅ − 𝑎′𝑥̅

Ces deux droites se coupent au point moyen G.

Exemple :

Les ventes au cours des 6 premiers mois ont été les suivantes :

Mois (x) Janvier Février Mars Avril Mai Juin

Ventes(y) 345 410 485 535 610 675

x y X=x-𝑥̅ Y=y-𝑦̅ X*Y X² Y²

1 345 -2,5 -165 412,5 6,25 27225

2 410 -1,5 -100 150 2,25 10000

3 485 -0,5 -25 12,5 0,25 625

4 535 0,5 25 12,5 0,25 625

5 610 1,5 100 150 2,25 10000

6 675 2,5 165 412,5 6,25 27225

21 3060 0 0 1150 17,5 75700

𝑥̅ =(1 + 2 + 3 + 4 + 5 + 6)

6 =21

6 = 3,5 𝑦̅ =(345 + 410 + 485 + 535 + 610 + 675)

6 =3060

6 = 510

(24)

ENP Mr : SAHNOUN.A.Y Page 24 𝑎 =1175

17,5 = 65,71

𝑏 = 510 − (65,71 × 3,5) = 280,02 L’équation de la droite de tendance est de la forme :

𝑦 = 65,71𝑥 + 280,02 Tendance exponentielle :

Les tendances exponentielles sont fréquentes et concernent le lancement de nouvelles activités, de nouveaux produits. On observe une accélération de plus en plus forte du rythme des ventes.

𝒚 = 𝒃. 𝒂

𝒙

On recherche une tendance linéaire :

𝑙𝑜𝑔(𝑦) = 𝑙𝑜𝑔(𝑏𝑎𝑥) = 𝑙𝑜𝑔(𝑏) + 𝑙𝑜𝑔(𝑎𝑥 ) = 𝑙𝑜𝑔(𝑏) + 𝑥 𝑙𝑜𝑔(𝑎)

On transforme une droite exponentielle en droite linéaire par les logarithmes décimaux.

𝑌 = 𝑙𝑜𝑔 (𝑦) 𝐴 = 𝑙𝑜𝑔 (𝑎) 𝐵 = 𝑙𝑜𝑔 (𝑏) 𝒀 = 𝑨 𝒙 + 𝑩

La fonction exponentielle représente une grandeur dont le taux périodique d’accroissement « a » est constant.

Exemple :

Période (x) Janvier Février Mars Avril Mai Juin

Quantité (y) 430 455 520 730 1140 1850

(25)

ENP Mr : SAHNOUN.A.Y Page 25

xi Y=log(yi) xi*Yi xi²

1 2,633 2,633 1

2 2,658 5,316 4

3 2,716 8,148 9

4 2,863 11,453 16

5 3,057 15,285 25

6 3,267 19,603 36

21 17,195 62,438 91

𝑥̅ =21 6 = 3,5 𝑦̅ =17,195

6 = 2,865

𝐴 =62,438 − 6 × 3,5 × 2,8658

91 − (6 × 3,5²) = 0,1289 ⇒ 𝑎 = 100,1289= 1,346 𝐵 = 2,8658 − 0,1289 × 3,5 = 2,4147 ⇒ 𝑏 = 102,4147= 1,346 La fonction ajustée est 𝑦 = 259,84 ∙ 1,346𝑥

Comment mesurer la qualité de l'ajustement Pour le modèle choisi, Y peut varier en fonction : - de X, selon la relation linéaire postulée

- d'autres variables non prises en compte et synthétisées dans le terme d'erreur.

On va mesurer la part de chacune de ces deux sources de variation pour évaluer la qualité de l'ajustement du modèle aux données.

On peut montrer la propriété suivante :

∑(𝑦𝑖− 𝑦̅)2 = ∑(𝑦𝑖− 𝑦̂𝑖)2+ ∑(𝑦̂𝑖− 𝑦̅)2

𝑛

𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1

Le coefficient de détermination R2

Afin d'avoir une idée globale de la qualité de l'ajustement linéaire, on définit R² le coefficient de détermination:

𝑅2=∑𝑛𝑖=1(𝑦̂𝑖− 𝑦̅)2

𝑛𝑖=1(𝑦𝑖− 𝑦̅)2

Références

Documents relatifs

Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de point.. A noter : Il existe également une droite d’ajustement de x en y en calculant

- On donne une série exprimant la population d’une ville en fonction des années et on souhaite faire des prévisions pour les années à venir. Les prévisions sortent du

L’ensemble des couples (X,Y) constitue une distribution à deux caractères, ou distribution à deux variables. Exemple : On considère la note en maths et en français de 12

Un exemple : nous avons récolté, auprès de 18 mamans, la taille (en cm) et le poids (en kg) de leur bébé le jour de ses trois mois (petites filles uniquement). On construit un

On appelle cette représentation graphique. A-t-il une forme longiligne ?.. Dans un laboratoire, on cherche à établir une relation entre deux grandeurs physiques.. Les mesures

Entrer le nuage de points dans le tableur, créer les variables réelles a et b, créer et tracer la droite (d) d'équation réduite y = ax + b, faire varier les valeurs de a et de b

• Indiquer List1 sur la ligne Var-X-List et List2 sur la ligne Var-Y-List.. Appuyez

alimentaires sera identique à la part des dépenses pour les services de santé (environ 11,5% des dépenses du ménage). En conclusion, ce problème propose trois méthodes