Enseignement scientifique – Terminale G1− 2020 / 21 Evolution démographique
Introduction Introduction Introduction Introduction
1) Sur papier millimétré, représenter graphiquement la population en fonction du rang.
On dit que l'ensemble des points obtenus forme un "nuage de points".
Dans la calculatrice on appuie sur la touche STATS puis dans l'onglet EDIT on choisit 1:Modifier et on rentre les valeurs de la liste : le rang dans la liste L1 et la population dans la liste L2.
Pour représenter le nuage de points on commence par configurer une fenêtre cohérente.
On appuie sur la touche FENÊTRE.
Le rang va de 0 à 223, on peut choisir de prendre un Xmin égal à 0 et un Xmax égal à 230 avec une graduation tous les 10 ans (Xgrad = 10).
La population va de 0 à 279284 on peut choisir Ymin = 0 puis Ymax = 300000 et Ygrad = 20000.
Ensuite on appuis sur 2NDE puis GRAPH STATS et on choisit le premier graphique disponible en appuyant sur 1.
On choisit alors successivement :
Aff (pour demander l'affichage des listes)
Le type de représentation (la première est celle du nuage de points) La "Xliste" c’est-à-dire celle qui fournira les abscisses (ici, le rang, donc L1) La "Yliste" c’est-à-dire celle qui fournira les ordonnées (ici, la population donc L2) Le type de symbole pour chaque point du nuage
La couleur.
On valide puis on appuie sur GRAPHE :
2) Quelle forme a le nuage de points ? Comment peut-on décrire cette évolution ?
Le nuage est globalement croissant, et la progression est sensiblement régulière. Les "aspérités"
correspondent à des anomalies statistiques qui s'expliquent dans le contexte historique (seconde guerre mondiale par exemple).
3) On appelle point moyen, et on note G, le point dont les coordonnées sont les moyennes de celles des points du nuage :
Si un nuage est constitué de n points M1(x1 ; y1) … Mn(xn ; yn), alors G(Òx ; Òy) où Òx= x1+…+xn
n et Òy= y1+…+yn
n .
On peut trouver ces données sur la calculatrice.
On appuie sur STATS puis dans l'onglet CALC on choisit 2: STATS 2 VAR (à deux variables)
On sélectionne les listes et on valide deux fois pour obtenir :
On trouve G(111,2;148154)
4) Tracer une droite "plausible" passant par G et la plus "représentative" de l'évolution graphique.
Chacun trace sur son papier millimétré une droite qui travers le nuage "au mieux" c’est-à-dire en étant le plus proche des points, et on la fait passer par le point moyen G.
5) Quelle semble être l'équation de cette droite ?
Rappel : une droite a pour équation y = ax+b
b est l'ordonnée à l'origine et correspond à la "hauteur" à laquelle la droite coupe l'axe des ordonnées :
a est le coefficient directeur et correspond à la pente de la droite :
On note en général ∆ la variation d'une grandeur.
Ici, on peut donc noter :
∆x la variation d'abscisse xB−xA ;
∆y la variation d'ordonnée yB−yA. Ainsi la formule devient :
a = ∆y
∆x
La droite obtenue dans le nuage de point et que l'on a tracée sur papier millimétré passe par le point moyen G(111,2 ; 148154).
D'autre part il semble que cette droite coupe l'axe des ordonnées en 20,5 de sorte que l'ordonnée à l'origine est donc b = 20500 compte tenu des unités.
b > 0 b = 0
b < 0
B
ƒB
ƒB
ƒy
B− y
Ax
B− x
Ax
By
By
Ax
A• B
• A
E prenant pour points G(111,2 ; 148154) et B(0;20500) on trouve le coefficient directeur : a = 148154−20500
111,2−0 % 1148.
La droite a donc pour équation y = 1148x+20500.
On en déduit des estimations de la population de Strasbourg :
On s'aperçoit que les estimations sont plausibles au regard des valeurs réelles dans le tableau; cela confirme la pertinence du modèle de régression linéaire.
6) On cherche une méthode qui fournisse la "meilleure droite" possible, c’est-à-dire celle qui minimise les erreurs faites en passant "près" des points au lieu de "sur les points".
Cette droite est appelée "droite de régression linéaire" et a pour équation y = ax+b avec des coefficients a et b fournis par la calculatrice : on appuie sur STATS, puis onglet CALC et 4: RégLin(ax+b).
On valide après avoir vérifié que les listes sont bien les bonnes (pour X et pour Y, conformes au nuage) et : année rang x (année – 1793) Population y
1950 157 200736
2020 227 281096
Dans l'affichage le nombre "r " s'appelle le coefficient de corrélation : plus il est proche de 1, meilleure est la qualité de la régression linéaire.
On trouve donc une équation différente de celle calculée "à la main". En fait, la calculatrice développe un algorithme qui permet d'avoir la "meilleure" droite possible. Il s'agit donc de :
y = 1206,56x+13991
On détermine comme à la question 5 de nouvelles estimations de la population de Strasbourg grâce à cette "meilleure"
Remarquons que pour aller plus vite on peut aussi utiliser un tableau de valeurs sur la calculatrice.
Pour cela on "rentre" l'équation de cette droite dans la zone des fonctions en appuyant sur F(X) puis on remplit la fonction Y1 avec l'équation de la droite de régression.
Puis on configure un tableau de valeurs en appuyant sur 2NDE puis DEF TABLE.
Là on choisit un début de table à -93 pour avoir accès à ce premier rang (qui correspond à l'année 1700) et un pas (∆Tbl) de 10.
Le pas est l'écart qu'il y aura entre les valeurs successives de x dans le tableau de valeurs.
On laisse tout le reste sur AUTO et on valide :
On appuis enfin sur 2NDE puis sur TABLE :
On utilise les flèches pour se déplacer dans le tableau et y chercher les valeurs de x dont on a besoin pour nos estimations.
Puis :
Et ainsi on a nos estimations :
On constate que les valeurs situées dans la plage de données, c’est-à-dire 1950 et 2020, sont cohérentes, comparées aux valeurs réelles des années proches.
Par contre celles situées loin de la période 1793 – 2016 pendant laquelle l'étude est faite, sont incohérentes. Une population négative en 1700, et une population gigantesque (près de 400000) en 2100, dont rien ne permet de confirmer qu'elle sera aussi forte.
Ainsi on s'aperçoit qu'une régression linéaire a du sens pour des estimations situées à l'intérieur de la plage de données. Elle est plus aléatoire quand on s'en écarte.
7) Les données ayant déjà toute été entrées on n'a plus qu'à appuyer sur GRAPHE pour obtenir la droite de régression linéaire et apprécier la façon dont elle travers le nuage "au plus près" des points.
année rang x (année – 1793) Population y
1700 -93 -98126
1950 157 203254
2020 227 287653
2100 307 384098
Evolution exponentielle Evolution exponentielle Evolution exponentielle Evolution exponentielle
Les tableaux ci-dessous donnent l'évolution de la population du Japon entre 1900 et 2010.
Voici le nuage de points associé à cette évolution.
1) Décrire la situation observée. Est-ce que le modèle précédent s'applique à cette évolution ? La croissance est en augmentation mais il y a deux périodes.
Jusqu'en 1980, la croissance accélère (courbe convexe), puis elle s'infléchit et ralentit (courbe convexe).
On peut considérer l'année 1945 comme une anomalie statistique (qui s'explique bien évidemment par les deux bombes atomiques d'Hiroshima et de Nagasaki en août 1945) car la croissance reprend immédiatement après au même rythme qu'avant.
Une régression linéaire ne convient pas (points non alignés).
2) On se concentre d'abord sur les 30 années entre 1950 et 1980.
a) Les points correspondant sont-ils alignés ? Non.
Est-on en présence d'une évolution dont la croissance accélère ou ralentit ? Elle accélère (convexe).
b) 1950 correspond au rang 50 puisque 1900 correspond au rang 0 donc on saisit ceci :
Puis on paramètre une fenêtre cohérente pour avoir tous les points, et au besoin les autre :
Puis on demande l'affichage de la série :
Et enfin on affiche :
c) Cette évolution porte le nom de croissance exponentielle. On va donc chercher un modèle algébrique non pas sous la forme d'une équation de droite y = ax+b mais sous la forme d'une équation de courbe du type y = a×bx.
Taper : menu STATS, onglet CALC puis 10: RégExp :
en vérifiant que les "Xliste" et "Yliste" sont bien celles dans lesquelles les données ont été rentrées, sinon changer leurs noms.
Cette fonction qui à x associe a×bx porte le nom de régression exponentielle.
Le coefficient "r" joue le même rôle que pour une régression linéaire : plus il est proche de 1, meilleure est la qualité (c’est-à-dire qu'un r proche de 1 confirme que la situation se prête bien à ce type de régression).
On obtient :
y = 46,79×1,012x
d) On utilise à nouveau un tableau de valeurs :
Et on note les estimations :
On s'aperçoit que le modèle fournit des données éloignées des relevés :
Cela vient du fait qu'après 1980 la croissance continue d'augmenter mais en ralentissant, alors que notre modèle est calculé sur les années de plus forte accélération.
Autrement dit le modèle va fournir une courbe convexe et ne sera donc plus fiable en zone où la courbe est devenue concave.
En effet :
année rang x (année – 1900) Population y en millions
1990 90 136,9
2000 100 154,24
2010 110 173,78
année Population estimée Population réelle
1990 136,9 123,5
2000 154,24 126,9
2010 173,78 128,6