STATISTIQUES A DEUX VARIABLES (CORRIGE)

(1)

STATISTIQUES A DEUX VARIABLES (CORRIGE)

EXEMPLE SUPPORT DE COURS N° 3 : LES TETRAS-LYRES

Dans un Parc National, le dénombrement des tétras-lyres (lyrurus tetrix) a été effectué à la création du Parc en 1965 alors que les populations existantes avaient été considérablement décimées par la pression de la chasse. Depuis, de nouveaux dénombrements ont été effectués tous les dix ans. Les résultats sont donnés dans le tableau suivant :

Années 1965 1975 1985 1995 2005

Effectifs 1800 2700 4000 6000 8700

1. Tracer le nuage de points représentatif de cette série statistique : en considérant que l'année 1 correspond à l'année 1965 , origine de l'axe des abscisses et 3 cm représentant 10 ans. On prendra 1500 comme origine sur l'axe vertical et 1 cm pour 1000 unités sur ce même axe.

21 31 41 51

2000 3000 4000 5000 6000 7000 8000 9000

1 11

0 1000

Années Effectifs

(2)

2. On décide dans un premier temps d'analyser l'évolution de la population de tétras-lyres avec une méthode de régression affine par la méthode des moindres carrés, les coefficients seront donnés avec une précision à 7 décimales.

On déterminera avec la même précision le coefficient de corrélation r

•

Y = 171 X + 1049

•

r

₁

= 0,97798948

3. Avec ce modèle, déterminer la prédiction de la population de tétras-lyres en 2015, 2025 ?

• 2015 : 2015 correspond à X=51, Y₅₁=171×51+1049

Y₅₁=9770 Nombre de tétras-lyres en 2015 : 9770

• 2025 : 2025 correspond à X=61 Y₆₁=171×61+1049

Y₆₁=11480 Nombre de tétras-lyres en 2025 : 11480

4. Dans un deuxième temps, on décide de modéliser cette série statistique par une régression EXPONENTIELLE sous la forme Y=ke^aX où k et a sont des nombres réels.

Déterminer l'équation de cette régression affine à l'aide de la calculatrice ainsi que le coefficient de corrélation correspondant.

• Y = 1742,06496 e

^0,0394958

• r

₂

= 0,99989181

5. Avec ce nouveau modèle, faites une prédiction de la population de tétras-lyres en 2015, en 2025.

• 2015 : 2015 correspond à X=51 Y51=1742,06496e0,0394958×51

(3)

• 2025 : 2025 correspond à X=61 Y₆₁=1742,06496e0,0394958×61

Y₆₁≈19381 Nombre de tétras-lyres en 2025 : 19381

6. Enfin, afin d'épuiser les modélisations qui doivent être connues de tout BTS GPN , on décide de modéliser cette série statistique par une régression PUISSANCE, c'est à dire d'écrire la régression de

Y en X sous la forme Y=k X^a où a et k sont deux nombres réels.

Il s'agit en fait de trouver la régression affine de la variable ln(Y) par la variable ln(X) sous la forme ln(Y)=aln(X)+b puis d'utiliser les propriétés de calcul des fonctions « exponentielle » et

« logarithme népérien » pour écrire : e^ln^(Y)=eâln(^X⁾⁺^b soit Y=(e^ln⁽^X⁾)â×e^b ou Y=e^b×Xâ donc le coefficient k=e^b.

A l'aide de la calculatrice déterminer directement la forme de régression PUISSANCE de Y en X ainsi que le coefficient de corrélation r

• Y = 1544,04996 X

^0,37731373

• r

₃

= 0,90117562

7. Avec ce nouveau modèle, prédire la population de tétras-lyres en 2015, en 2025.

• 2015 : 2015 correspond à X=51 Y51=1544,04996×51^0,37731373

Y₅₁≈6806 Nombre de tétras-lyres en 2015 : 6806

• 2025 : 2025 correspond à X=61 Y₆₁=1544,04996×61^0,37731373

Y₆₁≈7283 Nombre de tétras-lyres en 2025 : 7283

(4)

8. CONCLUSION : nous devons choisir le modèle d’analyse le plus pertinent pour cette série

statistique. Pour le faire, nous allons comparer les 3 coefficients de corrélation respectifs de chacun des modèles obtenus et observer celui dont la valeur absolue ∣r∣ est la plus proche de 1. C'est ce qui sera notre référence pour notre choix.

• Coefficient de corrélation par régression affine r₁=0,97798948

• Coefficient de corrélation par régression exponentielle

r

₂

= 0,99989181

• Coefficient de corrélation par régression puissance r₃=0,90117562 Quel sera notre modèle le plus pertinent ? :

le coefficient de corrélation dont la valeur absolue est la plus proche de 1 est le coefficient r₂ qui correspond au modèle de régression exponentielle.

C'est ce modèle qui sera retenu et donc, pour effectuer nos prédictions, on prendra la formule

Y = 1742,06496 e

^0,0394958^X

On peut donc prévoir la population de tétras-lyres pour n'importe quelle date (année)... Mais ce serait sans prendre en compte l'adaptation au milieu de cette population. Celle-ci est toujours contrôlée par un ou plusieurs facteurs du milieu. Sa croissance est donc exponentielle au début puis évolue d'une autre manière pour atteindre une « population seuil » dépendant par exemple de facteurs tels que la superficie du

territoire, les ressources disponibles, la population des prédateurs, etc...

Le modèle mathématique mis en place est donc valable au début de l'évolution de la population qui suit une

« loi normale » , c'est à dire que les facteurs identifiés plus haut sont tous influents mais aucun d'entre eux n'est prépondérant. Nous étudierons cette « normalité » dans le chapitre PROBABILITES.

(5)

DEMONSTRATIONS DE COURS A CONNAITRE

1. La régression EXPONENTIELLE est une forme de régression affine

La régression exponentielle de Y en X s’écrit sous la forme :

Y=ae^bX avec a , b∈ ℝ

• Y=ae^bX

• ln(Y)=ln(a)+ln(e^bX)

• ln(Y)=ln(ae^bX)

• ln(Y)=ln(a)+b×ln(e^X)

• ln(Y)=ln(a)+bX

•

ln (Y )= bX + ln (a )

On observe ici une régression affine de la variable ln ( Y ) par la variable X

2. La régression PUISSANCE est une forme de régression affine

La régression puissance de Y en X s'écrit sous la forme : Y=aX^b avec a , b∈ℝ

• Y=aX^b

• ln(Y)=ln(aX^b)

• ln(Y)=ln(a)+ln(X^b)

• ln(Y)=ln(a)+b×ln(X)

•

ln (Y )= b ln ( X )+ ln ( a)

On observe ici une régression affine de la variable ln ( Y ) par la variable

ln(X)

(6)

LES DIFFERENTS MODELES SOUS FORME GRAPHIQUE

MODELE DE REGRESSION AFFINE

Régression affine Y=171 X + 1049 r = 0.97798948

21 31 41 51

2000 3000 4000 5000 6000 7000 8000 9000

1 11

0 1000

(7)

MODELE DE REGRESSION EXPONENTIELLE

Régression exponentielle r = 0,99989181

20 30 40 50

2000 3000 4000 5000 6000 7000 8000 9000

0 10

1000

(8)

MODELE DE REGRESSION PUISSANCE

Régression puissance r = 0,90117562

21 31 41 51

2000 3000 4000 5000 6000 7000 8000 9000

1 11

0 1000