• Aucun résultat trouvé

Chapitre 4. Statistiques à 2 variables

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre 4. Statistiques à 2 variables"

Copied!
18
0
0

Texte intégral

(1)

Statistiques `a 2 variables

Yann Barsamian

´Ecole Europ´eenne de Bruxelles 1

Ann´ee scolaire 2020–2021

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 1 / 14

(2)

Les nuages de points Les ajustements

Interpolation et extrapolation

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 2 / 14

(3)

Dans une s´erie statistique `a deux variables, on s’int´eresse `a deux caract`eres x ety.

Exemple 1 : pour une classe de Terminale en math´ematiques, on regarde leur moyenne x au long de l’ann´ee et leur notey au bacca- laur´eat (sur 20). Voici des notes fictives pour une classe de 24 ´el`eves.

Ainsi, chaque couple (xi,yi) (pour i de 1 `a 24) repr´esente les notes d’un ´el`eve de la classe.

xi 8 9 7 15 12 12 10 8 11 11 7 8

yi 7 9 4 17 13 15 9 13 14 9 11 10

xi 11 11 12 12 7 9 9 5 9 5 10 4

yi 9 12 17 12 8 15 12 7 14 12 11 7

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 3 / 14

(4)

Pour visualiser ces deux caract´eristiques pour l’ensemble des 24 ´el`eves, on va r´ealiser un nuage de points.

0 5 10 15

0 5 10 15

b b

b b

bb

b

b bb

b b bb bb

b bb

b b

b b

b

Notes de l’ann´ee Notes au bac

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 4 / 14

(5)

Second exemple : on attache diff´erents objets `a un ressort, et on re- garde, pour chaque objet, la massexde l’objet attach´e, et la longueur y du ressort quand cet objet y est attach´e.

xi 7 10 18 20 5 24 12 3

yi 8.5 9 10.5 11 8 11.8 9.4 7.5

0 5 10 15 20

7 8 9 10 11

b b b b

b b

b

b Masse (g)

Longueur (cm)

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 5 / 14

(6)

Troisi`eme exemple : on a mesur´e, pour un sauteur en parachute, `a diff´erents temps x depuis le saut, sa vitesse y.

xi 50 70 100 130 180 230 260

yi 352 254 158 102 69 51 51

25 50 75 100 125 150 175 200 225 250 275

0 50 100 150 200 250 300

b b b b b b b

Temps (s) Vitesse (m/s)

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 6 / 14

(7)

On se servira beaucoup, dans ce chapitre, du point moyen du nuage.

C’est tout simplement le point qui a pour coordonn´ees (x,y).

0 5 10 15

0 5 10 15

b b

b b

bb

b

b bb

b b bb bb

b bb

b b

b b

b

+

G

Notes de l’ann´ee Notes au bac

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 7 / 14

(8)

On se servira beaucoup, dans ce chapitre, du point moyen du nuage.

C’est tout simplement le point qui a pour coordonn´ees (x,y).

0 5 10 15 20

7 8 9 10 11

b b b b

b b

b

b

+

G

Masse (g) Longueur (cm)

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 7 / 14

(9)

On se servira beaucoup, dans ce chapitre, du point moyen du nuage.

C’est tout simplement le point qui a pour coordonn´ees (x,y).

25 50 75 100 125 150 175 200 225 250 275

0 50 100 150 200 250 300

b b b b b b b

+

G

Temps (s) Vitesse (m/s)

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 7 / 14

(10)

Il est utile d’essayer d’exprimer une variable en fonction d’une autre.

On appellera variable d´ependante la variable “explicative”, et l’autre sera la variable ind´ependante. On essaye donc d’exprimer la variable ind´ependante en fonction de l’autre. Typiquement, on essayera d’ex- primer y en fonction dex.

Pour cela, on va donc essayer de tracer une fonction f(x) qui soit ressemblante au nuage de points. On va d´emarrer par les fonctions les plus simples : les fonctions affines (des droites).

A partir de maintenant, tout est `a la calculatrice ! Pour le pr´ebac,` vous n’avez rien `a savoir faire `a la main. Pour le baccalaur´eat, on verra d’autres m´ethodes dont l’une doit savoir ˆetre faite `a la main.

Par contre, il faut toujours garder son sens critique : est-ce que la fonction que je suis en train de tracer a l’air de bien correspondre au nuage de points ?

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 8 / 14

(11)

Tra¸cons `a la main des ajustements affines des 3 nuages de points donn´es en exemple.

0 5 10 15

0 5 10 15

b b

b b

bb

b

b bb

b b bb bb

b bb

b b

b b

b

+

G

Notes de l’ann´ee Notes au bac

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 9 / 14

(12)

Tra¸cons `a la main des ajustements affines des 3 nuages de points donn´es en exemple.

0 5 10 15 20

7 8 9 10 11

b b b b

b b

b

b

+

G

Masse (g) Longueur (cm)

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 9 / 14

(13)

Tra¸cons `a la main des ajustements affines des 3 nuages de points donn´es en exemple.

25 50 75 100 125 150 175 200 225 250 275

0 50 100 150 200 250 300

b b b b b b b

+

G

Temps (s) Vitesse (m/s)

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 9 / 14

(14)

Le coefficient de corr´elation lin´eaire de Bravais-Pearson, not´er.

Source : https://xkcd.com/1725/.

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 10 / 14

(15)

Le coefficient de corr´elation lin´eaire de Bravais-Pearson, not´er.

Source : https://fr.wikipedia.org/wiki/Corr%C3%A9latio n_(statistiques).

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 11 / 14

(16)

Au niveau de la calculatrice, il faut savoir faire les points 1 `a 4 de la vid´eo de tutoriel suivante :

https://www.youtube.com/watch?v=Nb2hmeoaMLo(le lien se trouve sur la page de notre cours : http://www.barsamian.am/S7P3/, tout en haut dans le programme officiel).

Rentrer une colonne pour xi, une colonne pouryi.

L’outil “Statistiques `a 2 variables” donne le point moyen et r.

L’outil “R´egression lin´eaire” calcule l’´equation de la droite de r´egression par la m´ethode des moindres carr´es y = mx +p (ainsi quer).

L’outil “Donn´ees et statistiques” permet d’afficher le nuage de points, conjointement avec la droite de r´egression.

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 12 / 14

(17)

Une fois qu’on a fait un mod`ele `a partir des donn´ees (ici, le mod`ele affine, via une droite de r´egression), on peut utiliser le mod`ele pour : Interpoler : trouver une valeur `a l’int´erieur du nuage (mais pas d´ej`a connue par un point).

Extrapoler : trouver une valeur `a l’ext´erieur du nuage.

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 13 / 14

(18)

Attention quand on extrapole. . .

Source : https://xkcd.com/605/.

Y. Barsamian (EEB1) S7P3 Chap. 4 : Statistiques `a 2 variables 2020–2021 14 / 14

Références

Documents relatifs

A chaque alignement, est associ´ e un score (simple ici) suivant: pour chaque position on associe 0 si les 2 bases sont identiques, +1 si les deux bases sont diff´ erentes et +3 s’il

Quelles sont les caract´eristiques observ´ees sur le march´e pour les produits spot et forward que le mod`ele 2 facteurs permet de reproduire?. Quels effets ne permet-il pas

On suppose que l’on observe seulement le nombre de particules dans le r´ecipient A au cours du temps, et que l’on d´esire estimer le nombre total de particules. Et construire

Cette sonde est constitu´ee d’un cˆ able coaxial analogue au pr´ec´edent et d’une tˆete de sonde comprenant une r´esistance R s de 9 MΩ en parall`ele avec un condensateur C

Regarder les hypoth` eses statistiques du mod` ele et analyser leurs cons´ equences (absence de biais, convergence, efficience).. Distinguer entre les cas d’erreurs h´ et´

I La multicollin´ earit´ e imparfaite n’est typiquement pas un signe d’une erreur logique dans le choix des variables explicatives du mod` ele, mais est due aux donn´ ees utilis´

En consid´erant les notations pr´ec´edentes avec J = ]0, 1[ et en notant Y la variable al´eatoire dont Y est une simulation, compl´eter le script pr´ec´edent pour que Z soit

Aujourd’hui on cherche ` a les g´ en´ eraliser ` a des structures de plus en plus complexes pour d´ etecter des d´ efauts soit lors d’un processus industriel (contrˆ ole de