• Aucun résultat trouvé

Statistiques à deux variables 1

N/A
N/A
Protected

Academic year: 2022

Partager "Statistiques à deux variables 1"

Copied!
2
0
0

Texte intégral

(1)

Statistiques à deux variables

1

Capacités :

➢ Représenter à l’aide des TIC un nuage de points.

➢ Déterminer le point moyen.

➢ Déterminer, à l’aide des TIC, une équation de droite qui exprime de façon approchée une relation entre les ordonnées et les abscisses des points du nuage.

➢ Utiliser cette équation pour interpoler ou extrapoler.

1. Caractérisation d'une série statistique à deux variables :

Une série statistique à deux variables est une série dont les valeurs sont données par les couples

(x ; y).

Elle est représentée dans un repère orthogonal par tous les points de coordonnées

(x ; y).

L'ensemble de ces points forme un nuage de points. Ce nuage peut avoir une forme allongée, curviligne ou très dispersée.

2. Point moyen :

Le point moyen d’un nuage de points a pour :

- abscisse, la moyenne des abscisses des points constituant le nuage ; - ordonnée, la moyenne des ordonnées.

Ce point est le point G(𝑥 ; 𝑦) 𝑎𝑣𝑒𝑐 𝑥 = ∑ 𝑛𝑖𝑥𝑖

𝑁 et 𝑦 = ∑ 𝑛𝑖𝑦𝑖

𝑁

3. Droite d'ajustement affine

Dans le cas d'un nuage de points de forme allongée, et afin de faciliter l'étude de la série, il est possible de remplacer ce nuage par une droite appelée droite d'ajustement affine.

La droite d’ajustement affine permet d’estimer la valeur d’un caractère quand on connait la valeur du 2ème caractère ou d’établir des prévisions.

La forme du nuage de points nous permet de dire qu’il existe une fonction affine «

y = f(x) = ax + b

» qui lie les valeurs

x

i

et y

i .

Pour tracer cette droite, on peut utiliser 3 méthodes :

Méthode empirique d’ajustement affine : il s’agit de tracer une droite qui passe par le point moyen G et au plus près d’un maximum de points du nuage. Cette méthode n’est pas complètement fausse mais dépend de l’opérateur.

Méthode de Mayer : elle consiste à :

- fractionner le nuage en 2 nuages dont les effectifs sont égaux ou différents de 1 ; - calculer les coordonnées des points moyens G1 et G2 des 2 parties du nuage ; - déterminer l’équation de la droite (G1 G2) qui

est de la forme y = a x + b

(2)

Statistiques à deux variables

2 Rappel : toute droite passant par les points G

1

(x

1

; y

1

) et G

2

(x

2

; y

2

) a pour équation

y = a x + b avec a =

1 2 2 1

G G G G

x x

y y

et b =

G G

1

1

ax

y

=

G G

2

2 ax

y

Méthode des moindres carrés :

Elle consiste à rechercher la droite telle que la somme des carrés des distances des points Mi (1≤i≤n) à la droite soit minimale.

Pour info :

r = 0,99146846 : est le coefficient de corrélation.

La valeur est comprise entre -1 et 1. La valeur est négative dans le cas d’une fonction décroissante et positive dans le cas d’une fonction croissante.

On utilise les outils numériques (calculatrice, logiciels, ....) afin de déterminer l’équation de la droite d’ajustement par la méthode des moindres carrés.

Interprétation des paramètres obtenus :

Donc l’équation du type

y = ax+b

, a pour expression

y = 1,5x+55,5

Pour info :

▪ r = 0,99146846 : est le coefficient de corrélation. Sa valeur est comprise entre -1 et 1.

La valeur est négative dans le cas d’une fonction décroissante et positive dans le cas d’une fonction croissante. Plus la valeur absolue est proche de 1, plus les points sont alignés.

▪ r² = 0,9830097 : est le coefficient de détermination. C’est le carré du coefficient de corrélation. Le coefficient de détermination R² est compris entre 0 et 1. Plus sa valeur se rapproche de 1, plus le pouvoir de prédiction grâce à l'ajustement est bon.

Références

Documents relatifs

Evangelista Torricelli, né le 15 octobre 1608 à Faenza, en Italie et mort le 25 octobre 1647 à Florence est un physicien et un mathématicien italien du XVIIe siècle.. Voici sa

Une forte corrélation entre deux grandeurs x et y ne signifie pas nécessairement qu’il y a un lien de causalité entre ces grandeurs. Par exemple, il est possible que les deux

1. On nomme G le point moyen du nuage. On choisit pour ajustement affine du nuage la droite D passant par G de coefficient directeur 2. On suppose que le nombre de visiteurs

L’objet de l’exercice est de faire des pr´ evisions sur l’effectif de la population d’´ el´ ephants de cette r´ eserve pour l’ann´ ee 2000.. Ces pr´ evisions seront

Plutôt que simplement étudier un seul caractère sur une population, on peut s'intéresser à l'étude de deux caractères en même temps.. STATISTIQUES Dans certains cas, le nuage

Théorème 90% des valeurs de d 2 obtenues lors de la simulation de la loi équirépartie sont infé- rieures à D 9 (le neuvième décile) ; si la valeur observée d 2 obs trouvée lors

 Les espèces qui évoluent plus vite que les autres pour les caractères utilisés se traduisent dans un arbre par une branche propre plus longue.  On a pu montrer théoriquement

[r]