Statistique à deux variable NP 2020 Page 1 sur 14
Statistique à deux variables
I) Activité : Prévoir la consommation d’électricité
Dans une journée, le pic de consommation d’électricité est atteint vers 19 h. Au niveau national on a enregistré un pic de consommation de 96 350 mégawatts le mercredi 15 décembre 2010 à 19 h 02. Vous travaillez à la centrale hydroélectrique locale et vous désirez prévoir les pics de consommation du prochain week-end pour la zone directement raccordée à votre centrale.
Pour établir cette prévision, vous disposez de dix relevés de consommations réalisés à 19h et présentés dans le tableau ci-dessous.
Relevé Température extérieure à 19 h (en °C)
Consommation à 19 h (en
MW)
Relevé Température extérieure à
19 h (en °C)
Consommatio n à 19 h (en
MW)
A 11 3 F 14 2,7
B -5 5,7 H 4 4
C -8 6,6 I -1 5,1
D -6 6,3 J -12 7,1
E 9 3,4 K 3 4,6
Représenter un nuage de points et déterminer le point moyen (4 min 39) https://www.youtube.com/watch?v=Nn6uckb3RvE&feature=youtu.be
a) Soit G(x ; y) le point moyen de cette série statistique à deux variables. x
représente la moyenne des températures en °C et y représente la moyenne de la consommation en MW. Déterminer les cordonnées de G(x ; y) et placer le point G sur le graphique de la page suivante. (Arrondir au dixième.)
x = ………… y = …………
b) Représenter graphiquement cette série statistique à deux variables (xi ; yi) dans le repère ci-dessous. Reporter la température en abscisse et la consommation électrique correspondante en ordonnée.
c) De quel type de courbe se rapproche ce nuage de points ?
………
d) Tracer une droite d’ajustement qui passe par le point moyen G. Cette droite passe le plus prés possible de la plupart des points du nuage.
Statistique à deux variable NP 2020 Page 2 sur 14
-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 14 (°C)
0 1 2 3 4 5 6 7 8
(MW)
e) La météorologie nationale prévoit 0°C et –3°C respectivement pour samedi et dimanche.
En utilisant la droite d’ajustement que vous venez de tracer, prévoyez les pics de consommation du week-end prochain.
Pour 0°C le pic de consommation sera de ………… MW.
Pour –3°C le pic de consommation sera de …………MW.
Une série statistique qui possède ………est dite …………………. Ces valeurs sont de la forme ……….
Pour représenter graphiquement une série statistique à deux variables, on place les point
………dans un ……….
L’ensemble des points est appelé ………. On peut déterminer un point moyen G( x ; y ).
Lorsque les points d’un nuage de points paraissent presque alignés, il existe une relation (………) entre les deux variables. On peut réaliser un ………, c'est-à-dire tracer ………qui passe par le ………et qui ………
……….
II) Série statistique à deux variables et ajustement affine :
Activité : Prévoir la consommation en fioul
Statistique à deux variable NP 2020 Page 3 sur 14
Pendant 6 semaines d’hiver, chaque semaine, on a enregistré la température moyenne relevée à 7 heures du matin et la consommation hebdomadaire de fioul d’un établissement scolaire. Les résultats sont les suivants :
Températures relevées en °C (xi) Consommation de fioul en L (yi)
-7 570
-4 435
0 390
-5 520
2 370
8 185
Déterminer et tracer la droite d’ajustement (moindres carrés) (10 min 10) https://www.youtube.com/watch?v=vdEL0MOKAIg&feature=youtu.be
1) Entrer les données de ce tableau dans la calculatrice en mettant en liste 1 les valeurs des températures et en liste 2 les consommations en fioul.
TI CASIO NumWorks
Appuyer sur la touche Choisir le menu 1 Edit
Si le tableau n’est pas vide, appuyer sur la t touche 4 ou
sélectionner ClrListe
puis faire
, la liste 1 est vide.
Compléter le tableau
Choisir le menu
Si le tableau n’est pas vide, appuyer sur la touche
puis sur la touche
Compléter le tableau
Choisir le menu à l’aide des flèches puis
.
Pour effacer une liste, se positionner sur X1 ,
puis et choisir . Compléter le tableau de
valeurs .
Statistique à deux variable NP 2020 Page 4 sur 14
2) Calculer les valeurs de x et de y
TI CASIO
Appuyer sur la touche
Célectionner “CALC” puis “2 variables”
puis
Sélectionner en appuyant sur puis
en appuyant sur et vérifier que les listes
correspondent
Après avoir cliquer sur
en appuyant encore sur
Se positionner sur , en se déplaçant à l’aide des
flèches verticalement puis horizontalement vers
, puis . Vous pouvez alors lire les valeurs du point moyen en regardant « moyenne »
.
x = ……… y = ………
3) Utiliser la fonction graphique pour représenter la série statistique à 2 variables
TI CASIO Numworks
Pour faire apparaître le nuage de points, appuyer sur
les touches , à
l’apparition de
appuyer sur
Sélectionner On et valider chaque paramètre en
appuyant sur Lorsque tous les paramètres ci-dessous sont sélectionnés.
Pour faire apparaître le nuage de points, appuyer sur
la touche
Puis sur la touche et enfin
Afficher
Appuyer ensuite sur et ensuite sur
Le nuage de points apparaît
Se positionner sur à l’aide des flèches puis . Le graphique apparait avec
par défaut une régression linéaire
Statistique à deux variable NP 2020 Page 5 sur 14
Appuyer ensuite sur et sélectionner Le nuage de points apparaît
4) Le mode statistique de la calculatrice permet de connaître l’équation y = ax + b de la droite d’ajustement affine.
TI CASIO NumWorks
Appuyer sur et sélectionner 4
pour voir
appuyer ensuite sur L’écran affiche alors
Appuyer sur
Pour voir apparaître
puis sur pour voir
Sur le même écran que précédemment on pourra
lires la valeur des coéfficient a et b de
l’équation de droite y = ax + b.
Afficher la droite d’ajustement avec la Casio 35+ (4 min 06) maths et tic https://www.youtube.com/watch?v=AYfsjiwsW00
Afficher la droite d’ajustement avec une T.I. 83 (5 min 15) maths et tic https://www.youtube.com/watch?v=lC1lfgYE51s
a) Indiquer les valeurs de a et de b à l’unité près.
a = ……… b = ………
b) Écrire l’équation de cette droite.
y = ………
5) Méthode des moindres carrés et coefficient de détermination r2:
Statistique à deux variable NP 2020 Page 6 sur 14
En utilisant les TIC (techniques informatique de calculs), on peut juger de la qualité d’une ……… en calculant ……….Une corrélation est forte quand r2 se rapproche de ………….
En principe cette valeur apparait lorsque l’on calcule les coefficients a et b de la droite de régression. Il arrive parfois que sur les anciennes T.I. celui-ci ne s’affiche pas, comment l’afficher.
TI CASIO NumWorks
Pour afficher les coefficients r et r2 sur la
calculatrice lorsque ces valeurs n’apparaissent pas :
Appuyer sur puis
Puis sélectionner
Appuyer sur , la fonction
apparait, appuyer une nouvelle fois sur
La fonction
est demandée. On peut lire
Sur certaines calculatrices un peu trop anciennes, il est
impossible de trouver la fonction précédente. Après
avoir déterminé les coefficients de a et de b de la droite d’ajustement y = ax + b. On peut faire apparaitre
On lit également sur le même écran les valeurs de r et r2.
Statistique à deux variable NP 2020 Page 7 sur 14
le coefficient r2 de la façon suivante : On appuie sur
, puis on sélectionne
, on se déplace avec les flèches vers la droite pour sélectionner le menu équation et on descend
toujours avec les flèches pour avoir le coefficient
. Lorsque la valeur r2 apparait,
on appuie sur et on obtient
6) Utilisation de la droite de régression :
L’ajustement affine donnant une ………, on peut l’utiliser pour faire ………………sur d’autres valeurs que celles observées.
On dit qu’on ………quand on cherche une valeur ………de l’intervalle des valeurs étudiées et qu’on ………quand on cherche une valeur ……… l’intervalle des valeurs étudiées.
Utiliser l’équation de la droite d’ajustement pour déterminer la consommation hebdomadaire de fioul lorsque la température est de 6°C. Dire s’il s’agit d’une interpolation ou d’une extrapolation.
y = ………
……….
Il s’agit d’une ………
Statistique à deux variable NP 2020 Page 8 sur 14
La consommation en fioul était de 436 L. Quelle température faisait-il alors ? Dire s’il s’agit d’une interpolation ou d’une extrapolation.
………
………
………
………
………
………
……….
III) Activité : Évolution de la masse salariale
Afin d’établir la masse salariale jusqu’en 2030, une entreprise a relevé, sur le site de l’INSEE, l’évolution du SMIC depuis 2010.
Année 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
Rang 0 1 2 3 4 5 6 7 8 9 10
SMIC horaire
brut en euros 8,86 9,00 9,22 9,43 9,53 9,61 9,67 9,76 9 ,88 10,03 10,15
Lorsque l’un des caractères est ………, la série est dite ……….1) Ouvrir le logiciel Geogebra 5 Dans affichage, afficher le tableur.
2) Dans la colonne A, noter le rang des années. Dans la colonne B, noter la valeur du SMIC horaire correspondante.
3) Avec la souris, sélectionner le tableau créé, puis, avec un clic droit, créer une liste de points.
4) Cliquer sur la fenêtre graphique afin de pouvoir déplacer l’origine des axes pour faire apparaître les points créés. (Faites tourner la molette de la souris dans un sens ou dans l’autre pour activer le zoom).
Si vous souhaitez centrer votre représentation graphique, cliquer d’abord sur
Statistique à deux variable NP 2020 Page 9 sur 14
puis cliquer sur la figure et sans lâcher le clic, déplacer celle-ci.
5) Après avoir sélectionné les valeurs dans le tableau , cliquer sur la petite flèche en bas à droite de l’icône “Statistique à une variable” et sélectionner “Statistique à deux variables”
On remarque que lorsque l’on clic sur le tableur, les icônes sont différentes que lorsque l’on clic sur la partie graphique.
Dans “source des données”, cliquer sur “Analyse”
Statistique à deux variable NP 2020 Page 10 sur 14
En fonction de l’aspect de la courbe, il faut choisir un modèle d’ajustement, ici on prendra
ajustement linéaire.
On arrondira les valeurs à deux décimales.
En cliquant sur l’icône , on obtient un certain nombre d’informations supplémentaires dont le point moyen et la valeur de r2.
6) Après avoir fermé la fenêtre « Analyse des données », on veut afficher le point moyen M (la lettre G est déjà prise) sur le repère.
Nota : Si vous souhaitez faire réapparaître la fenêtre d’analyse des données, il suffit de « resélectionner » les valeurs dans le tableau pour à nouveau avoir accès à l’icône
Statistique à deux variable NP 2020 Page 11 sur 14
Pour faire apparaître le point moyen, cliquer dans la zone la zone de saisie et taper : , la valeur a apparaît
puis ce qui donne
Attention: le nom de la liste doit être écrit de la même façon que dans la fenêtre Algèbre.
Ensuite pour faire apparaître le point M, taper: .
On veut également afficher la droite de régression y = 0,12x + 8,95. Il suffit de taper l’équation de cette droite dans la zone de saisie
Pour distinguer le point M sur le graphique, on l’affiche en rouge. Pour se faire, on
effectue un clic droit sur M (ou dans la fenêtre algèbre, ou dans la fenêtre graphique) et on affiche propriété. Il suffit alors de cliquer sur l’onglet couleur et de choisir la couleur.
7) Exploitation de cette courbe.
a) Créer un curseur nommé « d » allant de 0 à 20 avec une incrémentation de 1.
Il suffit de cliquer sur l’emplacement ou l’on souhaite déposer ce curseur. La fenêtre suivante apparaît. On complète le minimum, le maximum et l’incrémentation du curseur.
b) Dans la zone de saisie, saisir « x=d »
La droite d’équation x = d apparaît (droite verticale)
Statistique à deux variable NP 2020 Page 12 sur 14
c) Créer un point d’intersection entre cette droite et la droite de régression linéaire.
Vous pouvez déplacer cette droite en x = 12 afin de ne pas être gêné par les précédents points. Pour déplacer le curseur, il faut d’abord cliquer sur l’icône
puis cliquer sur Le logiciel appelle ce point le point L.
d) Déplacer le curseur et compléter le tableau suivant : Il suffit à chaque fois de lire l’ordonnée du point L.
Année 2021 2022 2023 2024 2025 2026 2027 2028 2029
Rang 11 12 13 14 15 16 17 18 19
SMIC horaire brut en euros
(Attention les valeurs obtenues dans ce tableau tiennent compte de l’arrondi au centième proposé, si on utilise la fonction « Evaluer de l’onglet Analyse des données », l’arrondi se fait à la fin ne tenant pas compte de l’arrondi initial de l’équation de la droite.)
8) L’entreprise compte 26 employés à temps plein (151,67 h mensuelles).
Calculer la masse salariale annuelle en 2021, puis en 2029.
En 2021, la masse salariale sera de ……….
En 2029, la masse salariale sera de ……….
9) Quelle sera le taux d’augmentation prévisible entre ces deux dates ? (Arrondir au centième)
Statistique à deux variable NP 2020 Page 13 sur 14
………
………
………
IV) Exercices :
Exercice N°1: Les données d’une série statistique à deux variables ont été enregistrées dans le tableau ci-dessous.
Valeurs de xi Valeurs de yi
0,054 0,919
0,061 0,908
0,074 0,882
0,057 0,915
0,085 0,873
0,092 0,857
0,114 0,835
0,125 0,814
Entrer ces données dans la calculatrice.
a) Pour déterminer qu’un ajustement affine est possible, on représente le graphique associé à cette série statistique. Quel type de représentation doit-on choisir ?
………
b) Donner les valeurs du point moyen (arrondir les valeurs au millième).
………
c) Écrire l’équation y = ax + b de la droite d’ajustement affine. On prendra les valeurs de a et de b à 10-3 prés. Donner la valeur de r2 avec la même précision.
a = ……… b = ……… y = ……… r2 = ………
d) A l’aide de l’équation de la droite d’ajustement affine, calculer la valeur de x à 10-3 prés si y = 0,85. Dire s’il s’agit d’une extrapolation ou d’une interpolation.
………
………
Il s’agit d……….
e) Calculer la valeur de y à 10-3 prés si x = 0,15. Dire s’il s’agit d’une extrapolation ou d’une interpolation.
y = ………. Il s’agit ……….
Exercice N°2 : Lorsque l’on a une série chronologique.
L’étude durant les six derniers mois du nombre de passagers transportés sur une ligne intérieure d’une compagnie « low cost » a donné les résultats suivants :
Statistique à deux variable NP 2020 Page 14 sur 14
Mois Nombre de passagers
Quelle prévision peut-on faire en termes de passager pour le mois de novembre ?
(Aide : les deux variables doivent être quantitatives, il faut donc attribuer x = 1 pour le mois de février etc…) a) Ecrire l’équation de la droite de régression, ainsi
que la valeur de r2. (a sera arrondi au centième, b à la l’unité et r2 au millième.)
La droite de régression est y = ………
r2 = ………
Février 1 220
Mars 1 400
Avril 1 610
Mai 1 815
Juin 2 040
Juillet 2 385
b) Calculer la prévision de passagers pour novembre.
Pour novembre, x = ………
y = ………passagers
Exercice N°3: On a mesuré la résistance thermique d’un isolant appliqué sur le mur d’une habitation. Des mesures ont été effectuées pour différentes épaisseurs d’isolant.
Les résultats suivants ont été obtenus.
Épaisseur de l’isolant en mm
Résistance thermique en m2.°C/W
A l’aide d’une calculatrice graphique ou d’un tableur, représenter graphiquement cette série statistique double.
a) Donner les coordonnées du point moyen du nuage de points. (arrondir
x à l’unité et y au centième) M( ……… ; ……… ) b) Écrire l’équation de la droite
d’ajustement affine et du
coefficient r2 en donnant les valeurs à 10-3 prés.
25 1,80
30 2,05
40 2,30
50 2,96
60 3,45
70 3,70
90 4,48
y = ……… r2 = ………
c) Estimer la résistance thermique obtenue si on prend un isolant de 80 mm
d’épaisseur. On prendra comme équation de la droite d’ajustement y = 0,04x + 0,77.
Résistance = ………
d) Estimer l’épaisseur d’isolant nécessaire pour une obtenir une résistance thermique d’environ 4,8 m2.°C/W. (Donner le résultat au cm prés)
………
………
………
………
L’épaisseur d’isolant sera de ……….