2020-2022 – S2 – Mathématiques – DEVOIR 1 CORRIGE page 1 sur 3
IUT de Saint-Etienne - département Techniques de Commercialisation
M. Ferraris Promotion 2020-2022 12/03/2021
Semestre 2 - MATHEMATIQUES – DEVOIR 1 durée : 1 heure 30 min – coefficient 1/2
CORRIGE
Exercice 1 : (4 points) QCM
Une seule bonne réponse par question - si réponse fausse, multiple ou manquante : 0 point 1) Pour la liste 8, 4, 12, 8, 16, 8, des moyennes mobiles peuvent être :
7 ; 9 ; 11 ; 12 8 ; 8 ; 12 ; 10,66 6 ; 8 ; 10 ; 12 ; 12 8 ; 10 ; 11 2) Soit les deux couples (x, y) suivants : (1, 5) et (3, 7). Alors Cov(X, Y) =
15 12 4 1
3) L’amplitude d’un intervalle de confiance au seuil de risque α augmente forcément si :
y’0 augmente y’0 augmente y’0 diminue y’0 diminue et α augmente et α diminue et α augmente et α diminue 4) Un résidu est un décalage entre :
deux points un point et la un point et la deux droites du nuage moyenne droite de régression de régression Exercice 2 : (5 points)
Le tableau ci-dessous montre les résultats d’un sondage pour lequel on a interrogé 300 personnes.
Les réponses à deux questions ont été croisées : l’âge de la personne (variable X) et la dépense mensuelle (estimée) de la personne en produits bio (variable Y). L’intérieur du tableau se compose des nombres de répondants dans chaque catégorie.
Y X (âge) [18 ; 25[ [25 ; 50[ 50 et plus
Moins de 30 € 70 91 47
Plus de 30 € 22 54 16
1) Au moyen d’un test du Khi-deux, décider si la dépense d’un individu en produits bio est liée à son âge, au seuil de 10% (vous expliquerez, en conclusion, ce que signifie concrètement ce seuil). 3 pts 1. Obtenir le Khi² calculé à partir des observations
observations valeurs théoriques Khi-deux
70 91 47 208 63,787 100,53 43,68 208 0,60522854 0,90402299 0,25234432 22 54 16 92 28,213 44,467 19,32 92 1,36834279 2,04387806 0,5705176
92 145 63 300 92 145 63 300
χ²calc = 5,744
2. Obtenir le Khi² correspondant au seuil de 10%
nombre de ddl = (3 – 1)(2 – 1) = 2. Sur la table, on lit χ²lim = 4,61.
3. Comparaison et décision
Puisque χ²calc > χ²lim, on en conclut que le tableau d’observations est « très » différent du tableau théorique : au seuil de 10%, on peut rejeter l’hypothèse d’indépendance entre dépense en produits bio et âge. Ici, on décide de dire que la dépense en produits bio est liée à l’âge, en prenant un peu moins de 10% de risque de se tromper.
2) Grâce à la table du Khi-deux, dire entre quels seuils de risque se trouve la p-valeur de votre test. En déduire le seuil (parmi ceux proposés par la table) en-dessous duquel on ne peut pas rejeter l’hypothèse nulle. 1 pt Le Khi-deux calculé est compris entre les Khi-deux des seuils 10% et 5%. Notre p-valeur se trouve donc entre ces deux probabilités. On ne peut rejeter H0 à un seuil inférieur ou égal à 5%, car le risque de se tromper en la rejetant est justement notre p-valeur et car le seuil de risque est le risque maximal admissible de se tromper en rejetant l’hypothèse nulle d’un test.
2020-2022 – S2 – Mathématiques – DEVOIR 1 CORRIGE page 2 sur 3
3) Donner les deux Khi-deux partiels les plus significatifs et commenter ce qu’ils indiquent. 1 pt Les Khi-deux partiels les plus élevés sont les deux premiers de la deuxième ligne. Ils traduisent un décalage plus fort qu’ailleurs entre les effectifs observés et les effectifs moyens attendus selon H0. Ici : notre échantillon a montré beaucoup moins de 18-25 ans que prévu suivant H0 et beaucoup plus de 25-50 ans, parmi les personnes dépensant plus de 30€ en produits bio. On estime donc que cette tendance se retrouve dans la population.
Exercice 3 : (11 points)
On s’intéresse à l’évolution de la population Française de 2001 à 2014, dont le tableau ci-dessous donne les relevés moyens annuels (source : INSEE 2015). L’objectif de l’exercice est de prendre la place d’une personne qui, en 2014, souhaite faire une estimation de la taille de la population en 2020. On comparera enfin cette
estimation au nombre réel de Français en 2020.
X : Année 1 (2001) 2 3 4 5 6 7
Y : Taille (millions) 61,16 61,60 62,04 62,49 62,96 63,49 63,78
X : Année 8 9 10 11 12 13 14 (2014)
Y : Taille (millions) 64,13 64,46 64,77 65,09 65,38 65,66 65,95
Partie 1 : régression linéaire sur le couple (X, Y)
1) Déterminer l’équation de la droite de Mayer associée à la série ci-dessus. 1 pt 2001-2007 : G1 (4 ; 62,503) et 2008-2014 : G2 (11 ; 65,063)
coefficient directeur : a = 2,56 / 7 = 0,3657 ; ordonnée à l’origine : b = 62,503 – 0,3657×4 = 61,04 Equation : y = 0,3657x + 61,04
2) a. Calculer la covariance du couple (X, Y) de ce tableau. Interpréter. 0,75 pt
(
,)
6780,95Cov 7,5 63,78286 5,982
14
X Y xy x y
n
=∑ − × = − × ≈
Elle est positive, ce qui traduit une augmentation globale de la population française au cours du temps.
b. Calculer le coefficient de corrélation linéaire de ce couple. Interpréter. 0,75 pt
(
,)
Cov 5,982143
0,9949 4,03113 1,49163
XY
X Y
r X Y
σ σ
= = ≈
× ×
Le coefficient est très proche de 1 : l’ajustement linéaire est peut-être une bonne modélisation.
3) Donner l’équation y’ = ax + b de la droite de régression selon la méthode des moindres carrés. 0,5 pt y’ = 0,3681x + 61,02
4) Déterminer une estimation de la taille de la population en 2020 par un intervalle de confiance à 99%.
On utilisera l’équation de la droite des moindres carrés. 2 pts
x y y' z
L’analyse de la variable Z donne : 0,999999 1 ; Z 0,002372
z≈ ≈ σ ≈
Estimation ponctuelle (x0 = 20) : y’0 = 0,3681×20 + 61,02 ≈ 68,3845
Coefficient u : 2,58
( ) ( )
[ ]
0 ; 0
67,97 ; 68,80
Z Z
I =y′× z− ×u σ y′× z+ ×u σ
= 1 61,16 61,39 0,99625346
2 61,6 61,7581319 0,9974395 3 62,04 62,1262637 0,99861148 4 62,49 62,4943956 0,99992966 5 62,96 62,8625275 1,00155057 6 63,49 63,2306593 1,0041015 7 63,78 63,5987912 1,00284925 8 64,13 63,9669231 1,00254939 9 64,46 64,3350549 1,0019421 10 64,77 64,7031868 1,00103261 11 65,09 65,0713187 1,00028709 12 65,38 65,4394505 0,99909152 13 65,66 65,8075824 0,99775736 14 65,95 66,1757143 0,99658917
2020-2022 – S2 – Mathématiques – DEVOIR 1 CORRIGE page 3 sur 3
5) a. Représenter graphiquement le nuage de points montrant l’évolution de la population française entre 2001 et 2014. Prévoir sur l’axe des abscisses des valeurs de x comprises entre 1 et 20, la valeur 1 représentant
l’année 2001 et la valeur 20 l’année 2020. 0,75 pt
voir en fin d’exercice
b. Tracer la droite d’ajustement trouvée en question 3. 0,5 pt
c. Cette droite vous parait-elle refléter la tendance montrée par le nuage de points ? 0,5 pt La droite est très proche des points, mais le nuage semble plutôt courbe.
Il apparait que la droite montre une croissance trop rapide à partir de 2013.
d. Représenter graphiquement l’intervalle trouvé en question 4. 0,5 pt e. Au 1er janvier 2020, on compte environ 67,064 millions d’habitants en France (Insee). Commenter vos
résultats précédents. 0,5 pt
En effet, la droite ne montrait pas la tendance réelle et conduisait à une surestimation.
Partie 2 : recherche d’un ajustement par une courbe On souhaite modéliser le nuage de points par une courbe.
Pour cela, on propose le changement de variable suivant : T = (X – 27)².
1) Après avoir calculé les valeurs de T sur une liste de votre calculatrice, donner l’équation de la droite de
régression (moindres carrés) du couple (T, Y). 1,5 pts
y’ = –0,09444t + 67,53
2) En déduire l’équation de la courbe de régression du couple (X, Y), suivant ce modèle, puis tracer cette courbe
sur le graphique. Commenter. 1 pt
y’ = –0,09444(x – 27)² + 67,53
La courbe semble beaucoup mieux épouser la forme du nuage de points.
3) Calculer, grâce à ce modèle, une estimation ponctuelle de la taille de la population française en 2020.
Commenter ce résultat en le comparant aux conclusions de la partie 1. 0,75 pt y’0 = –0,09444(20 – 27)² + 67,53 ≈ 67,065
Cette estimation, ne reposant sur aucune donnée ultérieure à 2014, est en fait étonnamment précise !
__________ FIN DU SUJET __________
60 61 62 63 64 65 66 67 68 69
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21