• Aucun résultat trouvé

LES PETITS HOMMES VERTS

N/A
N/A
Protected

Academic year: 2022

Partager "LES PETITS HOMMES VERTS "

Copied!
8
0
0

Texte intégral

(1)

ENFA - Bulletin du GRES n°8 – mai 1999 page 14

LES PETITS HOMMES VERTS

Notre première étude sur les petits hommes verts date de mai 1985.

Nous nous proposions de déterminer la nature de la relation entre : la taille X mesurée en cm et le poids Y exprimé en kg de ces petits hommes verts.

Nous disposions de données mesurées sur un échantillon de 12 petits hommes verts.

i 1 2 3 4 5 6 7 8 9 10 11 12

xi 29 32 35 34 40 38 35 41 44 40 45 46

yi 7 8 8.6 9.4 10.2 10.5 11 11.6 12.3 12.4 13.6 14.2 La première tâche fut bien sûr de représenter le nuage des points de coordonnées (xi,yi).

Représentation graphique des données:

Compte tenu du profil du nuage, rien ne semblait s'opposer à un ajustement affine du nuage.

En d'autres termes , nous proposions la modélisation suivante:

Si xi est la taille d'un petit homme vert

son poids théorique vaut y*i =α xi + β

la différence entre le poids réel yi de cet individu et le poids théorique est l'erreur notée εi

la répartition des erreurs ne dépend pas de xi

Cette répartition est supposée Normale N(0,σ).

Modèle de paramètres α et β.

ε

+ β + α

= x

Y

α et β sont les paramètres du modèle.

La taille x est la variable indépendante (explicative)et non aléatoire Le poids Y est la variable aléatoire dépendante(expliquée).

L'erreur

ε

est une variable aléatoire distribuée selon la loi Normale N(0,σ).

Les tailles xi sont 12 valeurs de taille x connues sans erreur de mesure.

Les erreurs εi sont 12 réalisations mutuellement indépendantes de la variable

ε

Chaque poids yi est une réalisation de la variable Yi =α xi + β +

ε

σ β

α, et sont les paramètres du modèle.

(2)

Nous devions alors :

1. Estimer les paramètres α et β du modèle.

2. Apprécier l'adéquation du modèle aux données recensées et à d'éventuelles données supplémentaires.

La "meilleure" méthode d'ajustement est la m é t h o d e d e s m o i n d r e s c a r r é s . Droite d'ajustement selon la méthode des moindres carrés

Pour simplifier la présentation de cette méthode, nous allons dans les calculs et illustrations qui suivent, nous limiter à un nuage de 5 points.

A. Résidus et Erreurs : des notions à bien différencier.

1. Le schéma ci-dessous permet de comprendre la notion d'erreur.

Les paramètres α et β sont connus par le dieu des petits hommes verts, mais inaccessibles à nous, pauvres mortels.

α et β nous sont à jamais inconnus Par conséquent, les cinq erreurs sont inconnues

5 4

3 2

1 , ε , ε , ε , ε

ε nous sont à jamais inconnues

2. Le schéma ci-dessous permet de comprendre la notion de résidu.

Considérons une droite d'ajustement empirique d'équation y = a x + b

(3)

ENFA - Bulletin du GRES n°8 – mai 1999 page 16

Les observations faites nous permettent de proposer deux nombres a et b comme

estimations empiriques des paramètres α et β

*

y5

* y4

* y3

* y2

*

y1 , , , ,

sont les estimations empiriques des poids théoriques d'individus de tailles

respectives

x1 , x2 , x3 , x4 , x5

e5 e4

e3 e2

e1 , , , ,

sont

les résidus relatifs à l'ajustement proposé pour l'échantillon observé B. Droite d'ajustement.

Quelles sont les contraintes auxquelles doit satisfaire la droite d'ajustement selon la méthode des moindres carrés ?

1. La moyenne des résidus

e doit être nulle.(justesse) i 5 0 4 e

3 e 2 e

1 e

e + + + + =

2. La variabilité des résidus

e doit être minimale.(précision) i

2 2

2 2

2

e5 e4

e3 e2

e1 + + + + doit être minimale

des contraintes somme toute très naturelles !!

1. Analysons la première contrainte,

(4)

Ajoutons membre à membre les 5 égalités suivantes :

1 1

1 a x b e

y = + +

2 2

2 a x b e

y = + +

3 3

3 a x b e

y = + +

4 4

4 a x b e

y = + +

5 5

5 a x b e

y = + +

Nous obtenons :

(

1 2 3 4 5

)

1 2 3 4 5

5 4 3 2

1 y y y y a x x x x x 5 b e e e e e

y + + + + = + + + + + + + + + +

Divisons chaque membre par 5 :

y = a x + b + e

Comme e doit valoir 0, il en résulte:

y = a x + b

2. Analysons la seconde contrainte

(

1

) (

1

)

1

1 1

1 donc y y a x x e

b x

a y

e b

x a

y − − − =

⎭⎬

⎫ +

=

+ +

=

(

2

) (

2

)

2

2 2

2 donc y y a x x e

b x

a y

e b

x a

y − − − =

⎭⎬

⎫ +

=

+ +

=

(

3

) (

3

)

3

3 3

3 donc y y a x x e

b x

a y

e b

x a

y − − − =

⎭⎬

⎫ +

=

+ +

=

(

4

) (

4

)

4

4 4

4 donc y y a x x e

b x

a y

e b

x a

y − − − =

⎭⎬

⎫ +

=

+ +

=

(

5

) (

5

)

5

5 5

5 donc y y a x x e

b x

a y

e b

x a

y − − − =

⎭⎬

⎫ +

=

+ +

=

Il en résulte :

( ) ( )( ) (

1

)

2

2 1

1 2

1 2

1 y y 2 a x x y y a x x

e = − − − − + −

( ) ( )( ) (

2

)

2

2 2

2 2

2 2

2 y y 2 a x x y y a x x

e = − − − − + −

( ) ( )( ) (

3

)

2

2 3

3 2

3 2

3 y y 2 a x x y y a x x

e = − − − − + −

( ) ( )( ) (

4

)

2

2 4

4 2

4 2

4 y y 2 a x x y y a x x

e = − − − − + −

( ) ( )( ) (

5

)

2

2 5

5 2

5 2

5 y y 2 a x x y y a x x

e = − − − − + −

Notons σxet σy les écart-types respectifs des séries statistiques

( )

xi et

( )

yi

( )

5 x x

5

1 i

2 i

2 x

=

=

σ et

( )

5 y y

5

1 i

2 i

2 y

=

= σ Notons σxy la covariance de la série double :

(

x x

)(

y y

)

5

1 i

i i

y x

=

= σ

(5)

ENFA - Bulletin du GRES n°8 – mai 1999 page 18

La variabilité des résidus vaut donc :

2 y xy

2 2 x 2

5 2 4 2 3 2 2 2

1 e e e e 5 a -10 a 5

e + + + + = σ σ + σ

La variabilité des résidus est une fonction du second degré en a qu'il s'agit de minimiser en choisissant judicieusement a.

Etudions la fonction f définie par :

( )

xy 2y 2

2

x a -10 a 5 5

a

f = σ σ + σ

Dérivée de f : f'

( )

a = 10σ2x a -10 σxy Signe de la dérivée de f :

( )

( )

2

x xy 2 x xy

a si seulement et

si 0 a ' f

a si seulement et

si 0 a ' f

σ

= σ

=

σ

> σ

>

Désignons par

α la quantité 2

x xy

σ σ Variations de f :

La droite d'ajustement selon la méthode des moindres carrés a donc pour équation :

+ β

α

= x

y

et

2

x

xy y x

= −

σ

= σ β α

α En posant

y x

xy

σ σ

= σ

r , nous obtenons

x y

σ

= σ

α r .

La variabilité des résidus relatifs à cet ajustement vaut

2 y xy

2 2

x -10 5 5

f ⎟= σ σ + σ

⎜ ⎞

⎛α α α .

Exprimons cette variabilité en fonction de r :

2 y x

y 2 xy

x 2 2 y

x x

y 5 -10 5

f

f + σ

σ σ σ σ

σ σ

⎟⎟=

⎜⎜ ⎞

⎛ σ

= σ

⎟⎠

⎜ ⎞

r r

r 2

α

soit f ⎟= 5 σ2y -10 σ2y + 5 σ2y

⎜ ⎞

2 2

r α r

a −∞ 2

x xy

σ

= σ

α +∞

f '(a) − 0 +

+∞ +∞ f (a)

⎟⎠

⎜ ⎞

⎝⎛α f

(6)

soit ⎟= σ

(

r2

)

⎜ ⎞

1 5

f α 2y

La variabilité des résidus relatifs à l'ajustement selon la méthode des moindres carrés vaut donc :

(

1

)

5 e e e e

e12 + 22 + 23 + 24 + 25 = σ2yr2 Formule n° 1 Quelque remarques :

La valeur de r ne dépend pas des unités choisies pour mesurer les xi et yi

r est donc un coefficient.

Compte tenu de la positivité de f : r est compris entre -1 et 1.

Si r2 =1, la variabilité des résidus est nulle : les points du nuage sont alors alignés.

La variabilité des résidus est d'autant plus faible que r² est proche de 1 (à σy constant) La valeur de r² permet d'apprécier la qualité de l'ajustement.

Le signe de r est celui de la pente de la droite : r est du signe de α

r est appelé coefficient de corrélation linéaire de la série (x yi, i). C. Décomposition de la variabilité totale.

* Nous désignerons par variabilité résiduelle la somme des carrés des résidus notée SCRes

5 2

1 i

i i

5

1 i

2 i Res

y* y

e

SC

∑ ∑

=

= ⎟⎟

⎜⎜

⎛ ∧

=

=

* Nous désignerons par variabilité totale, celle des

( )

yi

SC 5

(

y y

)

1 i

2 i

Tot

=

=

* Nous désignerons par variabilité expliquée la quantité notée SCExp définie par SCExp = SCTotSCRes

Compte tenu de la formule n°1

( )

=

=

5

1 i

2 i

2

Exp r y y

SC Ainsi

r SC

SC

Exp Tot

2 = = Variabilité Expliquée Variabilité Totale

Dans la mesure où r2 mesure la part de variabilité expliquée par l'ajustement r2 est appelé coefficient de détermination

Autre expression de SCExp:

SCExp = 5 r2 σ2y = 5 α2 σ2x Comme

*i = α xi + β y

, α2 σ2x est la variance de la série statistique

) ( y*i N'oublions pas d'autre part, que la moyenne des

( )

yi et celle des

)

( y*i sont égales:

(7)

ENFA - Bulletin du GRES n°8 – mai 1999 page 20

Il en résulte

= ⎟⎟

⎜⎜

⎛ −

=

5

1 i

2 i

Exp y* y

SC

(8)

Formule de décomposition de la variabilité

Res Exp

Tot

5 2

1 i

i i

5 2

1 i

i 5 2

1 i

i

SC SC

SC

* y y

_ y

* y _

y y

+

=

⎟⎟

⎜⎜

⎛ ∧

⎟ +

⎜⎜

⎛ ∧ −

⎟ =

⎜⎜

⎛ −

∑ ∑

= = =

C. analyse des résultats obtenus pour les douze points.

.

α = + 0 389

.

β = − 4 14

L'équation de la droite de régression de Y en x est

Y = + 0 389. x4 14. Variabilité expliquée: 47.839

Variabilité résiduelle: 6.528 Variabilité totale: 54.367

Le coefficient de détermination vaut : 0,88 367

. 54

839 .

r2 = 47 =

Ces résultats semblaient corrects !

Quelle ne fut pas notre surprise, lorsque quelques mois plus tard, furent retrouvés des renseignements égarés :

à savoir les consommations journalières en eau de chaque individu.

Le nuage de points prenait alors une toute autre signification:

En un seul instant, notre modèle n°1 était anéanti :

Qu'allait-on faire, pour tenir compte de ces nouveaux renseignements?

- = - = - = - = - = - = - = - = -

Références

Documents relatifs

Conclusion : lors de la subduction, la croûte océanique plongeante se trouve confrontée à des conditions de T° et de Pression caractéristiques, qui vont entraîner

Malgré cela, la variabilité observée entre deux mesures successives des mêmes animaux a été significativement plus forte dans le cas des pesées que dans celui des

Le travail semble ˆetre par d´efinition l’activit´e dans laquelle chacun peut tr`es facilement consid´erer que l’autre n’est qu’un objet, c’est d’ailleurs ainsi que

Dans les études faites par D EMARQUILLY nous constatons qu’en général les ensilages sont ingérés en quantité plus faible que les fourrages verts correspondants.. Afin

❑ Le mot déontologie (du grec deontos) , qui veut dire « devoir », il fait référence à une réflexion sur des règles, des devoirs, des obligations de comportement... ❑

Pour chaque pyramide proposé ci-dessous, déterminer le sommet, préciser la nature de la base, préciser la hauteur, compter le nombre de sommets, d’arêtes et de faces.. Et

Ensuite le Seigneur leur a dit : “L’homme est maintenant devenu comme l’un de nous, pour la connaissance du bien et du mal, il ne faut pas lui permettre de tendre la main pour

Sensibiliser les acteurs relais de la politique d’égalité professionnelle au Sicoval à la lutte contre les stéréotypes de genre et à la discrimination par le biais notamment