• Aucun résultat trouvé

JulieScholler-BureauB246 C 2.S RappelsduCMprécédent

N/A
N/A
Protected

Academic year: 2022

Partager "JulieScholler-BureauB246 C 2.S RappelsduCMprécédent"

Copied!
16
0
0

Texte intégral

(1)

DESCRIPTIVES BIVARIÉES SUITE

Julie Scholler - Bureau B246

Novembre 2020

.

Rappels du CM précédent

Deux caractères qualitatifs

lois marginales

lois conditionnelles → à comparer

Un caractère qualitatif (Y) + un quantitatif (X)

le caractère qualitatif : découpage en groupe

en plus des lois conditionnelles et marginales, on a des

moyenne, variance, médiane, quartiles, diagrammes en boîte

→ à comparer

indicateur synthétique de lien : η2 = Vinter V(X) Deux caractères quantitatifs

découpage en classes pour se ramener à la situation précédente

(2)

Lien baccalauréat-bonnes réponses en maths

Bac ES Bac S

0.0 2.5 5.0 7.5 10.0

Nombre de bonnes réponses en Maths

Sériedubac

ES S ES et S

Effectifs 70 55 125

Moyenne 4.69 6.2 5.35

Variance 3.9869 2.4145 3.8601

Vintra ' 3.2951

Vinter ' 0.5650

ηX2|Y ' 0.1464

V. Deux caractères quantitatifs

Lien entre bonnes réponses en maths et note finale

Maths

Note totale

[0,4[ [4,8[ [8,10[ [10,12[ [12,16[ [16,20]

[0,4[ 0 11 5 6 0 0

[4,6[ 0 3 16 16 7 0

[6,8[ 0 4 12 14 17 0

[8,10] 0 0 0 0 16 2

ηX2|Y ' 44%

[0,4[

[4,6[

[6,8[

[8,10]

4 8 12 16 20

Note totale

Bonnesréponses

(3)

4 8 12 16 20

0.0 2.5 5.0 7.5 10.0

Note totale selon la réussite en maths

-20 -10 0 10

20 30 40 50 60

Sur estimation selon le nombre de bonnes réponses

4 8 12 16 20

20 30 40 50 60

Note selon le nombre de bonnes réponses

2 4 6 8 10

1.0 1.5 2.0 2.5 3.0

Nombre de bonnes réponses en éco selon l’année

0 5 10 15 20

5 10 15 20

Note en littérature selon la note en éco

0 5 10 15 20

0 5 10 15 20

Note en littérature selon la note en géo

V. Deux caractères quantitatifs

Covariance

Observations : (x1,y1),(x2,y2), . . . ,(xi,yi), . . . ,(xn,yn) Covariance de X et Y

Cov(x,y) = 1 n

n

X

i=1

(xix)(yiy) En pratique, on utilise

Cov(x,y) = 1 n

n

X

i=1

(xiyi) −x ×y

Variance de X

V(x) = 1 n

n

X

i=1

(xix)2 = 1 n

n

X

i=1

xi2

!

x2

(4)

x

y [0,4[ [4,8[ [8,12[ [12,16[ [16,20] Marginale

[0,4[ 0 11 11 0 0 22

[4,6[ 0 3 32 7 0 42

[6,8[ 0 4 26 17 0 47

[8,10] 0 0 0 16 2 18

Marginale 0 18 69 40 2 129

x ' 745

129 ' 5.775 y ' 1399

129 ' 10.806

129

X

i=1

xiyi ' 7959 Cov(x,y) = 1

129

129

X

i=1

xiyix ×y ' 8526

129 − 745

129 × 1399

129 ' 3.69

V. Deux caractères quantitatifs

Nombre de bonnes réponses et sur-estimation

x : nombre de bonnes réponses en tout

y : différence entre le nombre de bonnes réponses obtenues et le nombre de bonnes réponses estimées

129

X

i=1

xi = 4 350

129

X

i=1

yi = −139

129

X

i=1

xiyi = −6 728 Cov(x,y) ' −16

(5)

x y

(xi x) (yi y)> 0 (xi x) (yi y)< 0

(xi x) (yi y)< 0 (xi x) (yi y)> 0

+ +

+

+ +

+ +

+ +

+ +

+

+

+ +

+

+

+

+

+

++

+

+ + ++

+

+ +

+ +

+

+

+ +

+ +

+ +

+

+ +

+

+ +

+

+

+

+

Covariance positive

V. Deux caractères quantitatifs

+ + +

+ +

+ +

+

+ +

+ +

+

+ + +

+

+ + + +

+ +

+ ++

+

+ + +

+ + +

+ +

+ + + + +

+

+ +

+ +

+ + +

+ +

Covariance négative

x y

(xi x) (yi y)> 0 (xi x) (yi y)< 0

(xi x) (yi y)< 0 (xi x) (yi y)> 0

(6)

+ +

+

+ +

+

+ +

+ +

+

+

+

+

+

+ +

+ +

+

+ +

+ +

+

+

+

+ +

+ +

+

+

+

+ +

+

+

+

+

+ +

+ +

+ +

+

+ +

+ +

+ +

+ +

+ + +

+

+ +

+

+

+

+

+

+

+

+ +

++

+

+

+ +

+ +

+

+ +

+

+

+ +

+ +

+

+ +

+

+ +

+

+ +

+

+

+ +

Covariance nulle

y

x

(xi x) (yi y)> 0 (xi x) (yi y)< 0

(xi x) (yi y)< 0 (xi x) (yi y)> 0

V. Deux caractères quantitatifs

+

+

+ +

+ + +

+

+

+ +

+ +

+ +

+

+ +

+ +

+ +

+ +

+

+ +

+

+ +

+ + + +

+

+

+

+ + +

+ +

+

+

+ + + +

+

+

+ +

+

+

+ +

+ +

+ +

+

+ + +

+

+ +

+ +

+ +

+ +

+ +

+

+ +

+ +

+

+ +

+ +

+

+ +

+ +

+

+ + +

+

+

+ +

+ + + +

+ + + +

+

+ +

+

+

+ + +

+ +

+ + + +

+ +

+ + + +

+ + +

+

+

+ +

+ +

+ +

+ + +

+

+ +

+

+

+

+ + +

+

+ +

+ +

+ +

+

+

+ +

+ +

+ + +

+

+

+

+ +

+

+

+ +

+

+ +

+

+

+ +

+ +

+ +

+

+ +

+

+ +

+

+ + + +

+ +

+

+ +

+

+

+ +

+ + +

+ +

+

+

+

+ +

+

+ +

+ + +

+ +

+

+

+

+ +

+ +

+ +

+ +

+

+

+

+ ++

+ + +

+

+ +

+

+

+

+ +

+

+

+ + +

+ +

+

+ + +

+

+ +

+

+ +

+

+ + +

+

+

+ +

+ + +

+ + +

+ +

+ +

+

+

+ + +

+

+

+

+

+ +

+ + +

+

+ +

+

+

+ +

+

+ +

+

+

+ +

+

+ +

+ +

+ +

+ +

+ +

+

+

+ + +

+ +

+ +

+ +

+ + +

+ +

+ +

+

+ + +

+ +

+ + +

+ +

+ +

+ + +

+

+ + +

+

+ +

+ +

+ +

+ +

+

+

+ + +

+

+ +

+ +

+

+ +

+

+

+ +

+ +

+

+ + +

+

+ + +

+ +

+ +

+

+ + +

+

+ +

+ +

+

+

+

+ +

+

+ +

+ +

+ +

+ + +

+

+ + +

+ + +

+ +

+

+ +

+ + + +

+ +

+ +

+ +

+

+ +

+ +

+

+ +

+ +

+ +

+

+ +

+

+ +

+

+ + +

+

+ +

+

+ +

+ +

+ +

+ +

+

+

+ +

+ + +

+ +

+ +

+ +

+ +

+

+

Covariance nulle

y

x

(xi x) (yi y)>0 (xi x) (yi y)< 0

(xi x) (yi y)< 0 (xi x) (yi y) >0

(7)

Remarque sur la covariance

la covariance ne « mesure bien » que les liens linéaires.

si Cov(x,y) > 0, on dit que les variables sont corrélées positivement :

« quand x augmente, y a tendance à augmenter également ».

si Cov(x,y) < 0, on dit que les variables sont corrélées négativement :

« quand x augmente, y a tendance à diminuer également ».

sa valeur dépend fortement des unités.

V. Deux caractères quantitatifs

Coefficient de corrélation linéaire ρx,y = Cov(x,y)

σxσy = Cov(x,y) pV(x)V(y)

Propriétés

−1 6 ρx,y 6 1

plus ρx,y est proche de 1 ou de -1, plus le lien entre les variables est fort.

(8)

x

y [0,4[ [4,8[ [8,12[ [12,16[ [16,20] Marginale

[0,4[ 0 11 11 0 0 22

[4,6[ 0 3 32 7 0 42

[6,8[ 0 4 26 17 0 47

[8,10] 0 0 0 16 2 18

Marginale 0 18 69 40 2 129

Cov(x,y) ' 3.69 V(x) ' 4.62 et V(y) ' 7.54 ρx,y ' 0.63

avec les données exactes non regroupées en classes : ρx,y ' 0.70

V. Deux caractères quantitatifs

4 8 12 16 20

0.0 2.5 5.0 7.5 10.0

Note totale selon la réussite en maths :ρ=0.70

-20 -10 0 10

20 30 40 50 60

Sur estimation selon le nombre de bonnes réponses :ρ=-0.30

4 8 12 16 20

20 30 40 50 60

Note selon le nombre de bonnes réponses :ρ=0.99

2 4 6 8 10

1.0 1.5 2.0 2.5 3.0

Nombre de bonnes réponses en éco selon l’année :ρ=0.24

5 10 15 20

5 10 15 20

Note en littérature selon la note en éco :ρ=0.12

0 5 10 15 20

0 5 10 15 20

Note en littérature selon la note en géo :ρ=0.48

(9)

Devinez le coefficient de corrélation linéaire :

https://gallery.shinyapps.io/correlation_game/

Attention de mêmes indicateurs synthétiques (coefficient de

corrélation linéaire, moyennes, variance) peuvent correspondre à des situations très différentes : https://www.autodesk.com/

research/publications/same-stats-different-graphs

V. Deux caractères quantitatifs

4 8 12 16 20

0.0 2.5 5.0 7.5 10.0

Note totale selon la réussite en maths :ρ=0.70

(10)

Ajustement linéaire

Recherche d’une droite (d’équation y = ax + b) passant

« au milieu » du nuage de point

au milieu : minimisant les écarts yiybi au carré avec ybi = axi +b

V. Deux caractères quantitatifs

X

i

(y

i

y ˆ

i

)

2

minimale

(y1yˆ1)

(y2yˆ2)

(y3yˆ3) (y4yˆ4)

(y5yˆ5)

(11)

Trouvez la droite de régression linéaire à tâtons :

http://shinyapps.org/showapp.php?app=https:

//tellmi.psy.lmu.de/felix/lmfit&by=Felix%20Sch%C3%

B6nbrodt&title=Find-a-fit!&shorttitle=Find-a-fit!

V. Deux caractères quantitatifs

Méthode d’obtention de la droite de régression linéaire

On veut minimiser la somme :

n

X

i=1

(yiyˆi)2

Cela revient à déterminer le minimum de la fonction F de deux variables a et b définie par :

F(a,b) =

n

X

i=1

(yiaxib)2

(12)

(x,y) : couple de variables statistiques quantitatives Droite de régression linéaire (des moindres carrés) Il s’agit de la droite d’équation y = ax + b avec

a = Cov(x,y)

V(x) = Cov(x,y) σx2 b = yax

V. Deux caractères quantitatifs

Application

4 8 12 16 20

0.0 2.5 5.0 7.5 10.0

Note totale selon la réussite en maths :ρ=0.70

(13)

Application - Note totale et bonnes réponses en maths

x ' 5.775, y ' 10.806, V(x) ' 4.62, Cov(x,y) ' 3.69

a = Cov(x,y)

V(x) ' 0.80 et b = yax ' 6.19

D : y = 0.80x + 6.19

V. Deux caractères quantitatifs

4 8 12 16 20

0.0 2.5 5.0 7.5 10.0

Note totale selon la réussite en maths :ρ=0.70

(14)

-20 -10 0 10

20 30 40 50 60

Sur estimation selon le nombre de bonnes réponses :ρ=-0.30

V. Deux caractères quantitatifs

Application

Nombre de bonnes réponses et sur estimation

129

X

i=1

xi = 4 350

129

X

i=1

yi = −139

129

X

i=1

xiyi = −6 728

129

X

i=1

xi2 = 155 068

129

X

i=1

yi2 = 5713

x ' 33.72, y ' −1.08, V(x) ' 64.98, Cov(x,y) ' −16

a = Cov(x,y)

V(x) ' −0.25 et b = yax ' 7.35 D : y = −0.25x + 7.35

(15)

-20 -10 0 10

20 30 40 50 60

Sur estimation selon le nombre de bonnes réponses :ρ=-0.30

V. Deux caractères quantitatifs

4 8 12 16 20

0.0 2.5 5.0 7.5 10.0

Note totale selon la réussite en maths :ρ=0.70

-20 -10 0 10

20 30 40 50 60

Sur estimation selon le nombre de bonnes réponses :ρ=-0.30

5 10 15 20

20 30 40 50 60

Note selon le nombre de bonnes réponses :ρ=0.99

2 4 6 8 10

1.0 1.5 2.0 2.5 3.0

Nombre de bonnes réponses en éco selon l’année :ρ=0.24

5 10 15 20

5 10 15 20

Note en littérature selon la note en éco :ρ=0.12

0 5 10 15 20

0 5 10 15 20

Note en littérature selon la note en géo :ρ=0.48

(16)

X

i

(yiyˆi)2 minimale

(y1yˆ1) (y2yˆ2) (y3yˆ3) (y4yˆ4)

(y5yˆ5)

X

i

(xixˆi)2 minimale

(x1ˆx1) (x2xˆ2) (x3xˆ3)

(x4xˆ4)

(x5ˆx5)

Références

Documents relatifs

Sans rentrer dans les détails, les roues sont considérées comme un investissement mais aussi peuvent améliorer notablement les qualités d’un vélo.. Un autre point à prendre

Si vous optez pour Manly, étendez votre visite en fin d’après-midi à North Head, en particulier North Head Scenic Drive, d’où vous pourrez admirer la baie de Sydney au coucher

et vous avez raison (même s'il n'y a aucune raison pour que ce premier modèle soit un échec... après tout, vous avez bien suivi nos précédents tutos). Voici donc quelques conseils

Dans la main gauche, passez le brin relié à la pelote sur l'auriculaire, autour du pouce et de l'index Accrochez-le avec le majeur et fermez la boucle en passant l'aiguille

N'écrasez pas les points en relief, recouvrez la planche d'un molle- ton très moelleux et repassez à la pattemouille sans jamais poser le fer, la vapeur seule doit régulari- ser

Avec des kilomètres de pistes cyclables, une coulée verte de 10 km qui traverse Valence d’est en ouest, et un réseau de vélos en libre-service répartis dans toute la ville (au prix

Côté assiette, le chef fait la part belle aux produits de saison et vous invite dans deux ambiances différentes : coté restaurant, dans l’esprit d’un bistrot gastronomique

C’est à ce moment que survient le boom des buildings à travers tout le pays (Vancouver, Calgary, Edmonton, Ottawa et Toronto, ainsi que Montréal dans une moindre mesure), mais