• Aucun résultat trouvé

Projet PRENUM-AC

N/A
N/A
Protected

Academic year: 2022

Partager "Projet PRENUM-AC"

Copied!
22
0
0

Texte intégral

(1)

Projet PRENUM-AC

Année 2014

Ressource Terminale D :

Statistiques : Séries statistiques doubles-Nuages de points (représentation, inertie, théorème de Huygens)-Ajustement linéaire par la méthode des moindres carrés-Correction linéaire.

PRODUCTION :

• CONCEPTEUR :

ETOUOLO ANOUONO WILFRID, étudiant à l’Ecole Normale Supérieure.

• ENCADREURS:

BINDOUNGA Rufin, enseignant à l’Ecole Normale Supérieure (université Marien Ngouabi de Brazzaville).

Paul TSIKA, enseignant à l’école militaire Marien NGOUABI.

(2)

I-Objectifs pédagogiques

A la fin de ce cours, l’élève devra être capable de :

représenter un nuage de points ;

• ajuster un nuage de points;

• calculer la corrélation linéaire;

• calculer l’inertie d’un nuage de points;

II. Place dans le programme:

Ce cours intervient après le cours sur les équations différentielles.

1. Pré-requis:

Avant ce cours, l’élève doit être en mesure de:

• calculer les caractéristiques d’une série statistique simple;

• représenter graphiquement une fonction;

• déterminer l’équation de la droite;

• calculer les coordonnées barycentriques d’un point du plan;

2-Aperçu historique

D’après l’histoire, l’origine du mot « statistique » remonte au latin classique status (Etat) qui, par une série d’évolutions successives, aboutit au français statistique, attesté pour la première fois en 1771. Avant cette date, le terme « statistique » a été déjà introduit par un professeur de Göttingen, G. Achenwall, qui aurait en 1746 créé le mot Statistik, dérivé de la notion Staatskunde, l’étymologie nous donne une histoire un peu plus complexe. Pendant cette époque, la statistique permettait de recueillir et de décrire des données numériques concernant des états ou des sociétés humaines. Un exemple nous est donné par l’Egypte ancienne où le Pharaon exigeait de ses sujets la déclaration de leurs noms, professions et moyens de subsistance afin de mieux les contrôler. D’autres exemples sont relatés par :

• La Chine : l’empereur chinois Yao, ordonne le recensement des productions agricoles en 2238 avant J-C (Gerbaud, 2006, p. 3).

• L’Inde : au IVème siècle avant J.-C. Kautilya, ministre du roi Candragupta (Empire indien des Maurya) rédige un traité de science politique et économique qui décrit les techniques de recensement des populations.

La statistique était essentiellement descriptive à cette époque .Ce n’est qu’à partir du XVIe

(3)

siècle qu’elle a évolué vers l’analyse des données, essentiellement grâce à l’astronomie : la position d’un objet céleste s’établit à partir d’une série d’observations. On verra alors apparaître successivement les paramètres de position, puis de dispersion.

3-Importance des statistiques :

Les statistiques sont conçues comme discipline de service ayant une composante culturelle.

Elles contribuent à l’amélioration des capacités participant au développement de

l’intelligence. Aujourd’hui, la statistique est devenue indispensable lorsqu’il s’agit d’éclairer une décision, porté un jugement ou prévoir le futur. Pour comprendre l’actualité, une

formation à la statistique est aujourd’hui indispensable ; c’est une formation qui développe des capacités d’analyse et de synthèse et exerce le regard critique.

III- Quelques notions importantes de la statistique ne figurants pas dans les programmes scolaires congolais

1. Diagramme en boîte ou boîte à moustaches

La boîte à moustaches, ou boîte à pattes, est un petit diagramme représentant divers caractères de dispersion d'une série statistique. Les cinq(5) nombres suivants : minimum (Min), premier quartile (Q1), médiane (Me), troisième quartile (Q3), maximum (Max) offrent un résumé possible d’une série statistique. La boîte à moustaches sert souvent pour comparer deux séries statistiques entre elles. Ce diagramme est constitué de la façon suivante : On trace une "boîte" qui est un rectangle dont la longueur s'étend du premier quartile au troisième quartile, et qui est coupé par un trait vertical à hauteur de la médiane. De cette boîte, partent deux traits horizontaux : l'un va du premier quartile à la valeur minimale de la série, l'autre du troisième quartile à la valeur maximale. Sur ces deux moustaches, on représente également en général les valeurs du premier et du dernier décile par des traits verticaux. Il sied de signaler que ce genre de diagramme n’est pas utilisé dans les programmes scolaires congolais, ce qui est un manque à gagner dans la comparaison de deux séries statistiques.

Exemple : Deux machines automatiques A et B conditionnent des paquets de riz dont la masse nette affichée est 250 grammes. Voici les pesées (en g) ak et bk du contenu de 100 paquets prélevés au hasard pour A et B, avec les effectifs et effectifs cumulés croissants correspondants :

(4)

Avec :

a

k

et

bk les poids respectivement de la machine A et B ;

n

k

et n’

kles effectifs correspondant respectivement àak et bk; Nk et N’k leurs effectifs cumulés.

Construire les diagrammes en boîte des deux séries et comparer les échantillons issus de A et B.

Solution

Par les effectifs cumulés croissants, on détermine les cinq nombres Min ; Q1 ; Me ; Q3 ; Max.

Pour la série A, la plus petite valeur telle que 25 au moins des 100 données lui soient inférieures ou égales est Q1 = 246 ; de même, on lit : Q3 = 253. Par ailleurs, Me = 250.

On obtient ainsi (240 ; 246 ; 250 ; 253 ; 260) pour A et (240 ; 248 ; 249 ; 252 ; 259) pour B.

Il reste à construire les diagrammes en boîte et à faire quelques commentaires.

Machine A

Machine B

Même si les étendues et les médianes des deux séries sont sensiblement les mêmes, la dispersion des données est plus grande pour A que pour B (écart interquartile 7 contre 4) ; les données sont donc plus concentrées autour de leur médiane pour B. Par ailleurs, une pesée sur

ak 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260

nk 1 4 1 5 3 8 4 8 5 8 11 9 6 8 3 2 6 4 1 2 1

Nk 1 5 6 11 14 22 26 34 39 47 58 67 73 81 84 86 92 96 97 99 100

bk 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260

n’k 1 0 0 1 0 2 7 12 17 16 10 8 9 8 2 4 2 0 0 1 0

N’k 1 1 1 2 2 4 11 23 40 56 66 74 83 91 93 97 99 99 99 100 100

(5)

deux dépasse 250 g avec A et pas avec B.

2- Résumer d’une série statistique en utilisant les paramètres

Dans une étude statistique, si l’on souhaite retenir un paramètre pour résumer une série, on choisit un paramètre de position : la moyenne ou la médiane.

Si l’on veut aussi rendre compte de la répartition des données autour de cette valeur centrale, on lui associe un paramètre de dispersion : l’écart type ou l’écart interquartile.

On obtient alors un couple de paramètres, qui ne prétend pas restituer toute l’information de la série statistique, mais qui permet d’en synthétiser l’essentiel et de faciliter la comparaison de plusieurs séries.

Le couple (Me ; Q3 - Q1)

Le partage des données ordonnées en quatre parties de même effectif conduit à associer naturellement la médiane et l’écart interquartile.

Le couple (Me ; Q3 - Q1), qui assoie la médiane et l’écart interquartile d’une série statistique, donne à la fois :

une indication de tendance centrale de la série ;

la longueur de l’intervalle contenant la moitié centrale de ses valeurs.

Le couple (Me ; Q3 – Q1) est un résumé d’une série statistique.

Plus Q3 - Q1 est petit, plus ses valeurs centrales se concentrent autour de la médiane Me.

Le couple (m ; )

Le lien existant entre la moyenne et la variance conduit de même à associer la moyenne et l’écart type.

Le couple (m ; ), qui associe la moyenne et l’écart type, fournit à la fois : un indicateur de tendance centrale de la série ;

une mesure des carrés des écarts à la moyenne de toutes les valeurs de la série.

Le couple (m ; ) est un résumé d’une série statistique.

Plus est petit, plus ses valeurs se concentrent autour de la moyenne m.

Choix du couple

(6)

Le couple (médiane ; écart interquartile) est assez facile à interpréter et à l’avantage d’être peu sensible aux valeurs extrêmes.

Contrairement à la moyenne, la médiane ne se calcule pas « par paquets ».

Le couple (moyenne ; écart type) joue un grand rôle en statistique théorique (par exemple appliquée aux sondages).

Cependant, il donne beaucoup de poids aux valeurs extrêmes et son choix n’est pertinent que lorsque le diagramme qui représente la série est assez symétrique et évoque la forme d’une courbe en cloche.

Nous avons relevé ici un point important qui est absent dans les programmes congolais. Il s’agit du travail autour des couples de paramètres. Lors d’une étude statistique, un couple de paramètres ne prétend pas restituer toute l’information de la série statistique, mais qui permet d’en synthétiser l’essentiel et de faciliter la comparaison de plusieurs séries.

Nous pouvons regretter que cette approche ne soit pas envisagée dans les programmes congolais. On peut alors s’interroger comment les élèves, n’ayant pas été entrainé dans cette approche conduisant à l’association des paramètres, pourront aborder des situations comme celles que nous proposons ci-dessous ?

(7)

Les notes obtenues par 200 candidats au QCM d’entrée d’une école d’ingénieurs ont conduit au calcul des paramètres suivants :

moyenne m : 11,4 écart type : 5,2 médiane Me : 13

écart interquartile Q3 – Q1 : 9.

1. Proposer deux couples de paramètres susceptibles de résumer cette série de notes ; les interpréter.

2. Comparer la note moyenne et la note médiane de cette série statistique. Que remarque-t-on ? 3. On donne à présent un diagramme représentant cette série.

a. Quelle observation peut-on faire?

b. Les deux couples évoqués en question 1 ont-ils la même pertinence pour résumer cette série?

4. Construire le diagramme en boîte de cette série.

5. Existe-t-il un résumé « idéal » de cette série?

Nous proposons une solution à cette situation:

Solution

1-Les couples de paramètres pouvant être retenus pour résumer cette série sont les couples (Me ; Q3 – Q1) = (13 ; 9) et (m ; ) = (11,4 ; 5,2).

Le premier couple donne une image partielle de la répartition des notes, assez facile à interpréter: «un élève sur deux a au moins 13 » ; « la moitié centrale des notes s’étale sur 9 points ».

Le couple (11,4 ; 5,2) donne la note moyenne et l’écart type dont la signification est plus difficile à appréhender, sauf à disposer de références à d’autre séries (plus est petit, plus les valeurs sont regroupées autour de m).

2- On remarque que les paramètres Me = 13 et m = 11,4 sont assez distants, et tels que Me m. Cela peut laisser penser que la série est certainement asymétrique (et plus étalée à gauche).

3- a. La représentation graphique a une forme qui confirme la forte asymétrie de la série.

b. Résumer la série par le seul couple (m ; ) paraît ici inapproprié.

(8)

4. Le diagramme en boîte utilise la liste des cinq nombres (Min ; Q1 ; Me ; Q3 ; Max).

La représentation graphique donne par simple lecture les effectifs des notes de 0 à 20 :

Xi 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

ni 1 3 5 11 17 9 7 2 1 3 7 13 20 19 16 19 16 13 9 6 3

La médiane est ici la moyenne des 100e et 101e termes de la série, soit Me = 13.

Q1 et Q3 sont respectivement les 50e et 150e termes de la série, soient Q1 = 6 et Q2 = 15.

On obtient donc : (Min ; Q1 ; Me ; Q3 ; Max) = (0 ; 6 ; 13 ; 15 ; 20), d’où le diagramme en boîte suivant, complété ici pour la moyenne m = 11,4 (losange rouge) :

5. Le « résumé idéal » d’une série n’existe bien sur pas, chaque paramètre ayant un intérêt variable selon le contexte et la nature des données. Cependant ici, au-delà du couple (Me ; Q3 – Q1) possible, on peut aussi proposer le diagramme en boîte ci- dessus, éventuellement complété par la moyenne m = 11,4

IV- Déroulement du cours Titre : statistiques

1. Activité 1

Un enquêteur a relevé le poids (en kg) et la taille (en cm) de 30 étudiants de l’Ecole Normale Supérieure (Université Marien Ngouabi) du département des sciences exactes. Les résultats sont représentés dans le tableau suivant :

Poids 65 68 62 62 68 68 59 71 74 68 68 74 71 65 65 62 65 68 71 65 74 74 71 65 59 74 62 59 68 71

Taille 165 165 168 170 165 160 168 171 165 160 162 168 170 165 171 171 160 168 165 160 166 166 171 162 165 160 160 162 170 170

(9)

1- Calculer le poids moyen et la taille moyenne de ces étudiants. En déduire les coordonnées du point G dont l’abscisse est la moyenne du poids et l’ordonnée la moyenne de la taille.

2- Dresser le tableau regroupant le poids et la taille de ces étudiants en précisant les effectifs correspondants à ces deux variables.

3- Que peut-on dire de ce tableau ? Solution

1- Calculons le poids moyen et la taille moyenne de ces étudiants Par définition :

Notons X la variable poids et Y la variable taille - Poids moyen

Soit l’ensemble des poids suivant : X = On obtient le tableau suivant :

x 59 62 65 68 71 74

ni 3 4 6 7 5 5

D’où la le poids moyen

Kg

- Taille moyenne

Soit l’ensemble des tailles suivant : Y = On obtient le tableau suivant :

Y 160 162 165 166 168 170 171

ni 6 3 7 2 4 4 4

(10)

D’où la taille moyenne :

cm

Déduisons les coordonnées de G : G(67,20 ; 165,63)

2- Dressons le tableau regroupant le poids et la taille de ces étudiants en précisant les effectifs correspondants à ces deux variables.

X Y

59 62 65 68 71 74

160 0 1 2 2 0 1

162 1 0 1 1 0 0

165 1 0 2 2 1 1

166 0 0 0 0 0 2

168 1 1 0 1 0 1

170 0 1 0 1 2 0

171 0 1 1 0 2 0

3- Il s’agit d’un tableau à double entrée

2. La série statistique double

L’étude des séries statistiques à un seul caractère s’avère insuffisante lorsqu’il s’agit de certains phénomènes aléatoires dépendant d’au moins deux caractères. Dans ces cas, on est contraint de considérer simultanément les caractères mis en exergue.

Toutefois, dans le cadre du programme de la terminale C et D, nous allons cibler notre étude sur les séries statistiques doubles.

(11)

2.1. Définition :

On appelle série statistique double ou série statistique à deux caractères (variables), l’ensemble des triplets (xi, yj, nij)où i et j et nij est l’effectif prenant simultanément les valeurs xi et yj des deux caractères X et Y.

Une série statistique double peut être représentée par un tableau à double entrée ou par un tableau linéaire.

• Tableau à double entrée :

xi

yj X1 X2 X3 ………… xp

Y1 n1.1 n2.1 n3.1 ………… np.1

Y2 n1.2 n2.2 n3.2 ………… np.2

Y3 n1.3 n2.3 n3.3 ………… np.3

. . .

. . .

. . .

. . .

…………

. . .

Yq n1.q n2.q n3.q ………… np.q

• Tableau linéaire d’une série double : X x1 x2 x3 …….…. xN

Y y1 y2 y3 ………… yN

Exemple 1 :

Le tableau linéaire suivant représente les notes obtenues en mathématiques et en physique par 12 candidats au baccalauréat :

Candidats 1 2 3 4 5 6 7 8 9 10 11 12

Note de mathématiques (xi) 10 7 10 11 15 8 11 18 7 15 15 10

Note de physique (yj) 11 10 7 10 13 11 10 4 12 4 13 7

Ce tableau linéaire suggère un deuxième type de représentation de la série statistique à deux caractères par un tableau à double entrée qui supprime l’identité des candidats c'est-à-dire des éléments de la population étudiée.

(12)

xi

yi

7 8 10 11 15 18

4 0 0 0 0 1 1

7 0 0 2 0 0 0

10 1 0 0 2 1 0

11 0 1 1 0 0 0

12 1 0 0 0 0 0

13 0 0 0 0 2 0

Remarque :

-Le tableau linéaire a permis d’obtenir le tableau à double entrée.

-Dans une série double, l’effectif total de la population est :

-La fréquence de (xi, yj) est :

Activité2

Reprenez l’activité 1 pour répondre aux questions suivantes : 1- Regrouper :

a) Le poids en classe d’amplitudes 3 dont la borne inférieure de la première classe est 59.

Calculer le poids moyen

b) La taille en classe d’amplitudes 2 dont la borne inférieure de la première classe est 160. Calculer la taille moyenne.

2- Représenter le tableau à double entrée.

Solution 1- Regroupons:

a) Le poids en classe d’amplitudes 3 dont la borne inférieure de la première classe est 59.

(13)

Classes [59 ; 62[ [62 ; 65[ [65 ; 68[ [68 ; 71[ [71 ; 74[ [74 ; 77[ ∑

ni 3 4 6 7 5 5 30

xi 60,5 63,5 66,5 69,5 72,5 75,5 /

nixi 181,5 254 399 486,5 362 ,5 377,5 2061

Calculons le poids moyen

= 68,7

b) La taille en classe d’amplitudes 2 dont la borne inférieure de la première classe est 160.

Classes [160 ; 162[ [162 ; 164[ [164 ; 166[ [166 ; 168[ [168 ; 170[ [170 ; 172[ ∑

ni 6 3 7 2 4 8 30

yi 161 163 165 167 169 171 /

niyi 966 489 1155 334 676 1368 4988

Calculons la taille moyenne.

2- Représentons le tableau à double entrée.

X Y

[59 ; 62[ [62 ; 65[ [65 ; 68[ [68 ; 71[ [71 ; 74[ [71 ; 77[

[160 ; 162[ 0 1 2 2 0 1

[162 ; 164[ 1 0 1 1 0 0

[164 ; 166[ 1 0 2 2 1 1

[166 ; 168[ 0 0 0 0 0 2

[168 ; 170[ 1 1 0 1 0 1

[170 ; 172[ 0 2 1 1 4 0

(14)

2 .2. Cas continu d’une série double (cas du regroupement en classe)

La série statistique double dans le cas continu est représentée par un tableau à double entrée comme dans le cas discret, la différence est que, dans le cas continu, les données sont regroupées par classes d’amplitudes. Dans la pratique, les classes peuvent être réduites par leurs valeurs centrales (xi).

L’effectif d’une classe [bi ; bs [est le nombre d’individus de la population étudiée, dont les modalités appartiennent à l’intervalle [bi ; bs[

Le centre d’une classe [bi ; bs [est le nombre xi= L’amplitude d’une classe [bi ; bs [est le nombre bs- bi

La densité d’une classe est le quotient de l’effectif par l’amplitude de la classe.

Avec :

xi est le centre du caractère X (le centre du caractère Y est yi et se calcule en utilisant la même formule que xi) ;

bs est la borne supérieure ; bi est la borne inférieure.

Exemple 2 : Le tableau suivant donne la répartition d’un échantillon de 100 candidats bacheliers suivant leurs notes d’histoire (H) et de philosophie(P). On ne dispose pas d’observation

individuelle. Les notes ont été regroupées par classe.

H(x)

P(y) [0-4[ [4-8[ [8-12[ [12-14[ [14-18[

[0 -4[ 2 1 0 0 0

[4-8[ 2 15 5 0 0

[8-12[ 0 4 40 10 0

[12-14[ 0 0 5 6 5

(15)

[14-18[ 0 0 0 4 1

En remplaçant les classes par leurs valeurs centrales, on obtient le tableau suivant:

H(x)

P(y) 2 6 10 13 16

2 2 1 0 0 0

6 2 15 5 0 0

10 0 4 40 10 0

13 0 0 5 6 5

16 0 0 0 4 1

2.3. Séries statistiques marginales:

Il est possible, à partir d’un tableau à double entrée, de reconstituer les séries simples associées, appelées séries marginales(ou lois marginales). Il suffit d’ajouter, dans le tableau à double entrée, pour chaque valeur d’un caractère l’effectif total associé.

On obtient ainsi le tableau suivant : yj

xi y1 y2 y3 …..… yq

x1 n1.1 n1.2 n1.3 …..… n1.q

x2 n2.1 n2.2 n2.3 ……… n2.q

x3 n3.1 n3.2 n3.3 ……… n3.q

. . .

. . .

. . .

. . .

……...

. . .

. . .

xp np.1 np.2 np.3 ……… np.q

…..… N

(16)

Avec

2.3.1. Loi marginale de X

Elle est représentée par le tableau suivant : xi x1 x2 X3 …… Xp

……

2.3.2. Loi marginale de Y

Elle est représentée par le tableau suivant : yj Y1 Y2 Y3 ……. yq

…….

Exemple3 : Le tableau suivant représente les notes de mathématiques et de physique obtenue par les élèves d’une classe de seconde C lors des devoirs surveillés :

Physique (yj) Math (xi)

5 8 10 12

11 2 7 3 5

15 1 2 0 1

Complétons ce tableau à double entrée en mettant en évidence d’une part les effectifs des modalités du caractère X, d’autre part, les effectifs des modalités du caractère Y.

yj

xi 5 8 10 12

11 2 7 3 5 17

15 1 2 0 1 4

(17)

3 9 3 6 21

Avec N = 21

Déduisons de ce nouveau tableau, la distribution statistique associée à X (loi marginale de X) et celle associée à Y (loi marginale de Y).

Loi marginale de X :

xi 11 15

17 4

Loi marginale de Y:

yj 5 8 10 12

3 9 3 6

2.4. Moyennes marginales, variances marginales et écart types marginaux

2.5.1. Moyennes marginales

Les moyennes marginales de X et de Y sont respectivement les nombres réels

et de tels que :

Ces formules ne sont autres que la moyenne arithmétique d’une série statistique simple.

2.4.2. Variances marginales

(18)

Les variances des séries marginales des caractères X et Y sont respectivement les nombres réels notés V(x) et V(y). Tels que:

et

Lorsque les valeurs sont répétitives on a et

2.4.3. Ecart-types marginaux

Les écart-types marginaux des caractères X et Y sont les nombres réels notés

Ils sont déterminés par des formules suivantes:

et

2.5. Covariance d’une série statistique double 2.5.1. Définition

On appelle covariance du couple (X, Y), le réel noté cov(x, y) tel que:

Lorsque les valeurs sont répétitives, on a

2.5.1. Théorème de Hughens-Koenig

(19)

Dans le cas où la série statistique est représentée par un tableau à double entrée.

Dans le cas où la série statistique est représentée par un tableau linéaire.

2.6. Représentation graphique d’une série statistique

2.6.1. Nuage statistique

Dans un repère orthogonal, on représente une série statistique double (xi, yj, nij) par un ensemble de points Mij(xi, yj) en indiquant à coté de chacun d’eux l’effectif non nul nij. Cet ensemble de points est appelé nuage statistique.

2.6.2. Point moyen du nuage

On appelle point moyen d’un nuage des points représentant la série statistique (xi, yj, nij), le point G( appelé aussi barycentre des points Mij(xi, yj) affectés de coefficients respectifs nij.

Remarque :

Si la série statistique double est représentée par un tableau linéaire, on a

2.6.3. Inertie d’un nuage par rapport à un point 2.6.3.1. Définition:

On appelle inertie d’un nuage des points Mij affectés de coefficients nij par rapport à un point A, le nombre réel noté IA tel que:

2.6.3.2. Remarque:

L’inertie du nuage par rapport au point moyen est tel que:

(20)

I

G

= N[V(x) + V(y)]

2.6.3.3. Propriété:

I

A

= I

G

+ N.AG

2

NB: IG est l’inertie minimum

2.6.4. Ajustement linéaire d’un nuage statistique par la méthode des moindres carrées

2.6.4.1. Définition:

Ajuster un nuage statistique par la méthode des moindres carrées, c’est déterminer:

Soit une droite (D) d’équation y = ax + b appelée droite de régression de y sur x;

• Soit une droite (∆) d’équation x = αy + β appelé droite de régression de x sur y;

de façon que (D) ou (∆) soit la plus proche possible des points du nuage.

2.6.4.2. Propriété:

(D) et (∆) passent par le point moyen G(

2.6.4.3. Théorème

Détermination de la droite de régression de y sur x Le coefficient directeur de la droite (D) est:

Soient les droites (D) et (D’) telles que:

(D):

y = ax + b

; (D’):

+ b

En faisant entre première et la deuxième équation on a

Donc

(21)

D’où

(D):

C’est l’expression de la droite de régression de y sur x

Détermination de la droite de régression de x sur y Le coefficient directeur de la droite (∆) est:

Soient les droites (∆) et (∆’) telles que:

(∆): x = αy + β; (∆’):

En faisant la différence entre la première et la deuxième équation on a

Donc D’où

(∆)

C’est l’expression de la droite de régression de x sur y 2.6.5. Coefficient de corrélation linéaire 2.6.5.1. Définition:

Le coefficient de corrélation linéaire entre deux caractères X et Y est le nombre réel, noté r tel que:

2.6.5.2. Remarques:

Le coefficient de corrélation est tel que │r│≤ 1 r2 = a.α

(22)

Lorsque r = 0 c'est-à-dire cov(x, y) = 0, la corrélation entre X et Y est dite minimale. On dit aussi que les deux variables sont indépendantes. Dans ce cas, (D) et (∆) sont parallèles aux axes.

Lorsque r = 1 ou r = -1, la corrélation entre X et Y est dite maximale. Les deux droites de régression sont confondues.

Si │r│est proche de 1 alors (D) et (∆) sont proches l’une de l’autre, on dit qu’il y a une bonne corrélation ou une forte corrélation entre les deux variables.

En général on considère que la corrélation linéaire entre les deux variables est forte lorsqu’on a

0,87≤ r ≤ 1.

Références

Documents relatifs

Lycée d'Amboise (ALBI) - Spécialités en Première Générale - 20 trinômes possibles-. Tableau (à double entrée) des

Ce travail unifie et prolonge des résultats obtenus sur les densités des parties de N, d’une part, et les limites des moyennes des fonctions positives, d’autre

Dans la mesure où l'évolution future des importations et des exportations de chaque pays concerné fait déjà l'objet de prévisions (officielles ou non), on doit considérer que les

Reproduis les formes et colorie-les de la bonne couleur.. Tableau à

Dessine les œufs, colorie-les de la bonne couleur et reproduis les graphismes au bon endroit... Tableau à

Colorie les tortues de la bonne couleur et reproduis les graphismes au bon endroit ou colle.. Tableau à

Colle les tortues de la bonne couleur et reproduis les graphismes au bon endroit.. Tableau à

Retrouve la consigne du tableau à double entrée et colle les images au bon endroit... Tableau à