STATISTIQUES A DEUX VARIABLES (CORRIGE)
EXEMPLE SUPPORT DE COURS N° 3 : LES TETRAS-LYRES
Dans un Parc National, le dénombrement des tétras-lyres (lyrurus tetrix) a été effectué à la création du Parc en 1965 alors que les populations existantes avaient été considérablement décimées par la pression de la chasse. Depuis, de nouveaux dénombrements ont été effectués tous les dix ans. Les résultats sont donnés dans le tableau suivant :
Années 1965 1975 1985 1995 2005
Effectifs 1800 2700 4000 6000 8700
1. Tracer le nuage de points représentatif de cette série statistique : en considérant que l'année 1 correspond à l'année 1965 , origine de l'axe des abscisses et 3 cm représentant 10 ans. On prendra 1500 comme origine sur l'axe vertical et 1 cm pour 1000 unités sur ce même axe.
21 31 41 51
2000 3000 4000 5000 6000 7000 8000 9000
1 11
0 1000
Années Effectifs
2. On décide dans un premier temps d'analyser l'évolution de la population de tétras-lyres avec une méthode de régression affine par la méthode des moindres carrés, les coefficients seront donnés avec une précision à 7 décimales.
On déterminera avec la même précision le coefficient de corrélation r
•
Y = 171 X + 1049
•
r
1= 0,97798948
3. Avec ce modèle, déterminer la prédiction de la population de tétras-lyres en 2015, 2025 ?
• 2015 : 2015 correspond à X=51, Y51=171×51+1049
Y51=9770 Nombre de tétras-lyres en 2015 : 9770
• 2025 : 2025 correspond à X=61 Y61=171×61+1049
Y61=11480 Nombre de tétras-lyres en 2025 : 11480
4. Dans un deuxième temps, on décide de modéliser cette série statistique par une régression EXPONENTIELLE sous la forme Y=keaX où k et a sont des nombres réels.
Déterminer l'équation de cette régression affine à l'aide de la calculatrice ainsi que le coefficient de corrélation correspondant.
• Y = 1742,06496 e
0,0394958• r
2= 0,99989181
5. Avec ce nouveau modèle, faites une prédiction de la population de tétras-lyres en 2015, en 2025.
• 2015 : 2015 correspond à X=51 Y51=1742,06496e0,0394958×51
• 2025 : 2025 correspond à X=61 Y61=1742,06496e0,0394958×61
Y61≈19381 Nombre de tétras-lyres en 2025 : 19381
6. Enfin, afin d'épuiser les modélisations qui doivent être connues de tout BTS GPN , on décide de modéliser cette série statistique par une régression PUISSANCE, c'est à dire d'écrire la régression de
Y en X sous la forme Y=k Xa où a et k sont deux nombres réels.
Il s'agit en fait de trouver la régression affine de la variable ln(Y) par la variable ln(X) sous la forme ln(Y)=aln(X)+b puis d'utiliser les propriétés de calcul des fonctions « exponentielle » et
« logarithme népérien » pour écrire : eln(Y)=ealn(X)+b soit Y=(eln(X))a×eb ou Y=eb×Xa donc le coefficient k=eb.
A l'aide de la calculatrice déterminer directement la forme de régression PUISSANCE de Y en X ainsi que le coefficient de corrélation r
• Y = 1544,04996 X
0,37731373• r
3= 0,90117562
7. Avec ce nouveau modèle, prédire la population de tétras-lyres en 2015, en 2025.
• 2015 : 2015 correspond à X=51 Y51=1544,04996×510,37731373
Y51≈6806 Nombre de tétras-lyres en 2015 : 6806
• 2025 : 2025 correspond à X=61 Y61=1544,04996×610,37731373
Y61≈7283 Nombre de tétras-lyres en 2025 : 7283
8. CONCLUSION : nous devons choisir le modèle d’analyse le plus pertinent pour cette série
statistique. Pour le faire, nous allons comparer les 3 coefficients de corrélation respectifs de chacun des modèles obtenus et observer celui dont la valeur absolue ∣r∣ est la plus proche de 1. C'est ce qui sera notre référence pour notre choix.
• Coefficient de corrélation par régression affine r1=0,97798948
• Coefficient de corrélation par régression exponentielle
r
2= 0,99989181
• Coefficient de corrélation par régression puissance r3=0,90117562 Quel sera notre modèle le plus pertinent ? :
le coefficient de corrélation dont la valeur absolue est la plus proche de 1 est le coefficient r2 qui correspond au modèle de régression exponentielle.
C'est ce modèle qui sera retenu et donc, pour effectuer nos prédictions, on prendra la formule
Y = 1742,06496 e
0,0394958XOn peut donc prévoir la population de tétras-lyres pour n'importe quelle date (année)... Mais ce serait sans prendre en compte l'adaptation au milieu de cette population. Celle-ci est toujours contrôlée par un ou plusieurs facteurs du milieu. Sa croissance est donc exponentielle au début puis évolue d'une autre manière pour atteindre une « population seuil » dépendant par exemple de facteurs tels que la superficie du
territoire, les ressources disponibles, la population des prédateurs, etc...
Le modèle mathématique mis en place est donc valable au début de l'évolution de la population qui suit une
« loi normale » , c'est à dire que les facteurs identifiés plus haut sont tous influents mais aucun d'entre eux n'est prépondérant. Nous étudierons cette « normalité » dans le chapitre PROBABILITES.
DEMONSTRATIONS DE COURS A CONNAITRE
1. La régression EXPONENTIELLE est une forme de régression affine
La régression exponentielle de Y en X s’écrit sous la forme :
Y=aebX avec a , b∈ ℝ
• Y=aebX
• ln(Y)=ln(a)+ln(ebX)
• ln(Y)=ln(aebX)
• ln(Y)=ln(a)+b×ln(eX)
• ln(Y)=ln(a)+bX
•
ln (Y )= bX + ln (a )
On observe ici une régression affine de la variable ln ( Y ) par la variable X
2. La régression PUISSANCE est une forme de régression affine
La régression puissance de Y en X s'écrit sous la forme : Y=aXb avec a , b∈ℝ
• Y=aXb
• ln(Y)=ln(aXb)
• ln(Y)=ln(a)+ln(Xb)
• ln(Y)=ln(a)+b×ln(X)
•
ln (Y )= b ln ( X )+ ln ( a)
On observe ici une régression affine de la variable ln ( Y ) par la variable
ln(X)LES DIFFERENTS MODELES SOUS FORME GRAPHIQUE
MODELE DE REGRESSION AFFINE
Régression affine Y=171 X + 1049 r = 0.97798948
21 31 41 51
2000 3000 4000 5000 6000 7000 8000 9000
1 11
0 1000
Années Effectifs
MODELE DE REGRESSION EXPONENTIELLE
Régression exponentielle r = 0,99989181
20 30 40 50
2000 3000 4000 5000 6000 7000 8000 9000
0 10
1000
Années Effectifs
MODELE DE REGRESSION PUISSANCE
Régression puissance r = 0,90117562
21 31 41 51
2000 3000 4000 5000 6000 7000 8000 9000
1 11
0 1000
Années Effectifs