• Aucun résultat trouvé

Corrig&eacute du TP 4

N/A
N/A
Protected

Academic year: 2022

Partager "Corrig&eacute du TP 4"

Copied!
5
0
0

Texte intégral

(1)

ECE2 TP n 4 : Statistique descriptive bivari´ ee

Exercice 1. Un exemple simple

On g´en`ere une s´erie statistique double (X, Y) avec la commande :

x=rand(1,50); y=-2.1*x+2+0.4*grand(1,50,’nor’,-1,0.3);

Ecrire des commandes permettant de tracer la droite de r´egression deYenX.

--> x=rand(1,50); y=-2.1*x+2+0.4*grand(1,50,’nor’,-1,0.3);

--> plot2d(x,y,style=-1) --> a=corr(x,y,1)/variance(x)

a =

- 2.0903124

--> b=corr(x,y,1)/variance(x)*(-mean(x))+mean(y)

b =

1.6071256 --> xx=0:0.1:1;

--> yy=a*xx+b;

--> plot(xx,yy)

Exercice 2. ´Evolution du PIB en France en fonction de la consommation ´energ´etique Le tableau suivant fournit des donn´ees arrondies sur la France m´etropolitaine.

Ann´ee A 1950 1960 1965 1973 1985 1990 2000 2005 2006 2008 2010 2012

Consommation ´energ´etique (en TEP) W 63 90 115 180 202 229 269 277 276 273 263 259

PIB en volume (base 100 en 1973) G 30 50 66 100 132 154 188 203 208 213 210 214

Population (en millions) P 41.6 45.5 48.7 51.9 55.2 56.6 58.9 61 61.4 62.1 62.8 63.4 1. Tracer le nuage de point associ´e `a (W, G). Que remarque t’on ?

Une partie des points est bien align´ee, et on a un petit tas de points. On constate qu’`a partir de l’an 2005, la contrainte ´energ´etique semble avoir pr´ec´ed´e l’arrˆet de la croissance.

(a) Avec les donn´ees entre 1950 et 2000, d´eterminez la droite de r´egression associ´ee au couple (W, G) et le coefficient de corr´elation. Tracer cette droite. Interpr´etez ces r´esultats.

--> W=[63 90 115 180 202 229 269 277 276 273 263 259];

--> G=[30 50 66 100 132 154 188 203 208 213 210 214];

--> X=W(1:7); Y=G(1:7);

--> plot2d(X,Y,style=-3) --> xx=60:0.1:270;

--> a=corr(X,Y,1)/variance(X);

--> b=corr(X,Y,1)/variance(X)*(-mean(X))+mean(Y);

--> yy=a*xx+b;

--> plot2d(xx,yy)

--> corr(X,Y,1)/stdev(X)/stdev(Y) // calcul du coefficient de corr´elation empirique pour 1950-2000 ans =

0.8511205

On retrouve la corr´elation historique entre le d´eveloppement ´economique et la consommation ´energ´etique.

(b) Mˆemes questions avec les donn´ees de 2000 `a 2012.

--> W=[63 90 115 180 202 229 269 277 276 273 263 259];

--> G=[30 50 66 100 132 154 188 203 208 213 210 214];

--> X=W(7:12); Y=G(1:12);

--> plot2d(X,Y,style=-3) --> xx=60:0.1:280;

--> a=corr(X,Y,1)/variance(X);

--> b=corr(X,Y,1)/variance(X)*(-mean(X))+mean(Y);

(2)

--> yy=a*xx+b;

--> plot2d(xx,yy)

--> corr(X,Y,1)/stdev(X)/stdev(Y) // calcul du coefficient de corr´elation empirique pour 2000-2012 ans =

- 0.2045191

L’´evolution de la consommation ´energ´etique est peu corr´el´ee avec l’´evolution du PIB. Une prise de conscience

´

energ´etique est en partie responsable de ce ph´enom`ene.

2. ´Etudiez le nuage de points associ´ee `a las´erie chronologique (A, G./W),G/W repr´esentel’efficacit´e ´energ´etique.

L’efficacit´e ´energ´etiqueG/W a fortement augment´ee entre 1973 et 1984 et depuis l’an 2000.

3. ´Etudiez l’´evolution du PIB par habitant.

Le PIB par habitant croit de mani`ere quasi-lin´eaire jusqu’au d´ebut des ann´ees 2000 puis stagne.

Exercice 3. Un peu de criminologie

Un chercheur en sociologie veut analyser, s’il existe une relation lin´eaire entre la densit´e de population dans les villes et le taux de criminalit´e correspondant dans ces villes.

Le taux de criminalit´eY est indiqu´e en nombre de crimes par 10 000 habitants et la densit´e de population X est mesur´ee en milliers d’habitants par km2.

R´egion 1 2 3 4 5 6 7 8 9 10 11 12

xi 7.7 5.8 11.5 2.1 3.7 3.6 7.5 4.2 3.8 10.3 8.6 7.2

yi 12 9 15 4 4 2 10 3 5 11 10 11

1. Si la r´egion 3 a une superficie de 20 km2, quel est le nombre de crimes dans cette r´egion ?

Il y a 11.5 crimes pour 10000 habitants, comme il y a 15000 habitants par km2, il y a donc 11.5∗15000/10000 = 17.25 crimes par km2. Ainsi il y a 17.25∗20 = 345 crimes dans cette r´egion.

2. Tracer le nuage de points de ces observations.

--> x=[7.7 5.8 11.5 2.1 3.7 3.6 7.5 4.2 3.8 10.3 8.6 7.2];

--> y=[12 9 15 4 4 2 10 3 5 11 10 11];

--> plot2d(x,y,style=-3)

3. Calculer les coefficients de la droite de r´egression.

--> a=corr(x,y,1)/variance(x)

a =

1.2006798

--> b=corr(x,y,1)/variance(x)*(-mean(x))+mean(y)

b =

0.3956946 --> xx=0:0.1:12;

--> yy=a*xx+b;

--> plot(xx,yy)

4. Le taux de criminalit´e et la densit´e de population sont-ils corr´el´es ? --> corr(x,y,1)/stdev(x)/stdev(y)

ans = 0.8407705

Oui, le coefficient de corr´elation lin´eaire est proche de 1.

5. A quelle augmentation du taux de criminalit´e pouvons-nous nous attendre pour une variation de 1000 habitants par km2 de la densit´e de population ?

--> corr(x,y,1)/variance(x)*1 ans =

1.2006798

Pour une augmentation de 1000 habitants par km2, il faut s’attendre `a une augmentation de 1.2 du taux de criminalit´e.

6. Estimer le taux de criminalit´e le plus plausible pour une densit´e de population de 7 500 habitants par km2.

(3)

--> corr(x,y,1)/variance(x)*(7.5-mean(x))+mean(y) ans =

9.4007931

Exercice 4. Un Mc Do ? Bof

Dans le cadre d’une enquˆete visant `a comparer selon certain crit`eres, le tableau suivant fournit des donn´ees de diff´erents aliments vendus dans lesfast-food.

Aliment Poids (g) Prix (euros) Sandwich v´eg´etarien 150 3.90

Sandwich parisien 92 3.40

Big Mac 193 5.70

Hamburger 90 2.90

Hot Dog 135 3.80

Fallalel 241 6.00

Quiche lorraine 169 3.30

Pizza ”tomates et fromage” 165 3.30

1. Repr´esenter sur un graphe le poids (en abscisse) et le prix (en ordonn´ee) des aliments expos´es. Existe-t-il une relation entre les deux variables ?

--> x=[150 92 193 90 135 241 169 165];

--> y=[3.90 3.40 5.70 2.90 3.80 6.00 3.30 3.30];

--> plot2d(x,y,style=-3)

2. Tracer et d´eterminer la droite de r´egression.

--> a=corr(x,y,1)/variance(x)

a =

0.0164526

--> b=corr(x,y,1)/variance(x)*(-mean(x))+mean(y)

b =

1.4976337 --> xx=80:0.1:250;

--> yy=a*xx+b;

--> plot(xx,yy)

3. Votre entreprise con¸coit un sandwich de 200g. Vous souhaitez mettre cet aliment sur le march´e. En utilisant la droite de r´egression, quel serait le prix moyen d’un tel aliment ?

--> corr(x,y,1)/variance(x)*(200-mean(x))+mean(y) ans =

4.7881488

Exercice 5. Urbanisation et natalit´e

Le tableau suivant contient la liste de 13 pays d’Am´erique du Nord et d’Am´erique Centrale, dont la population d´epassait le million d’habitants en 1985. Pour chaque pays, on mesure le taux de natalit´e (nombre de naissances annuel pour 1000 habitants) ainsi que le taux d’urbanisation (pourcentage de la population vivant dans des villes de plus de 100000 habitants).

Pays Taux d’urbanisation Taux de natalit´e

Canada 55.0 16.2

Costa-Rica 27.3 30.5

Cuba 33.3 16.9

USA 56.5 16.0

El Salvador 11.5 40.2

Guatemala 14.2 38.4

Ha¨ıti 13.9 41.3

Honduras 19.0 43.9

Jama¨ıque 33.1 28.3

Mexique 43.2 33.9

Nicaragua 28.5 44.2

Panama 37.7 28.0

Rep. Dominicaine 37.1 33.1

(4)

1. Repr´esenter sur un graphe le taux d’urbanisation (en abscisse) et le taux de natalit´e (en ordonn´ee) des pays propos´es. D´eterminer le coefficient de corr´elation lin´eaire entre les deux variables.

--> x=[55 27.3 33.3 56.5 11.5 14.2 13.9 19 33.1 43.2 28.5 6.8 37.7 37.1];

--> y=[16.2 30.5 16.9 16 40.2 38.4 41.3 43.9 28.3 33.9 44.2 24.6 28 33.1];

--> plot2d(x,y,style=-3)

--> corr(x,y,1)/stdev(x)/stdev(y) ans =

- 0.5768150

Le taux d’urbanisation et le taux de natalit´e semblent corr´el´es pour les pays d’Am´erique du Nord.

2. Tracer et d´eterminer la droite de r´egression.

--> a=corr(x,y,1)/variance(x) a =

- 0.3703770

--> b=corr(x,y,1)/variance(x)*(-mean(x))+mean(y) b =

42.141731 --> xx=0:0.1:60;

--> yy=a*xx+b;

--> plot(xx,yy)

3. Utiliser la droite de r´egression pour pr´evoir l’´evolution du taux de natalit´e si le taux d’urbanisation augmente de 5% de la population.

--> corr(x,y,1)/variance(x)*5 ans =

- 2.4713276

Le taux de natalit´e baisse alors d’environ 2.5%.

4. Les USA ont aujourd’hui un taux d’urbanisation de 60%, en supposant que le comportement des am´ericains n’a pas chang´e en 30 ans, d´eterminer approximativement le taux de natalit´e aux USA en 2016.

Leur taux de natalit´e est actuellement de 13% (source : banque mondiale).

Exercice 6. Population agricole et consommation alimentaire

Soient les donn´ees pr´esent´ees dans le tableau ci-dessous. Il s’agit du nombre de calories consomm´ees par jour et du pourcentage de population agricole dans 11 pays en 1981.

Pays % Population agricole Calories par jour et par personne

Suisse 4.0 3 432

France 5.7 3 273

Su`ede 4.9 3 049

USA 3.0 3 642

Ex-URSS 14.8 3 394

Chine 69.6 2 628

Inde 63.8 2 204

Br´esil 26.2 2 643

P´erou 38.3 2 192

Alg´erie 24.7 2 687

Ex-Zaire 65.7 2 159

1. Repr´esenter graphiquement les donn´ees.

--> x=[4.0 5.7 4.9 3.0 14.8 69.6 63.8 26.2 38.3 24.7 65.7]

--> y=[3432 3273 3049 3642 3394 2628 2204 2643 2192 2687 2159]

--> plot2d(x,y,style=-3)

2. Tracer et d´eterminer la droite de r´egression.

--> a=corr(x,y,1)/variance(x) a =

(5)

- 15.60321

--> b=corr(x,y,1)/variance(x)*(-mean(x))+mean(y) b =

3300.6318 --> xx=0:0.1:70;

--> yy=a*xx+b;

--> plot(xx,yy)

3. Utiliser la droite de r´egression pour connaitre l’augmentation du nombre de calories consomm´ees par jour et par personne en Chine sachant que la population agricole a aujourd’hui baiss´e de 25% de la population totale.

--> corr(x,y,1)/variance(x)*(-25) ans =

390.08025

On observe alors une augmentation de 390 calories par jour et par personne.

Références

Documents relatifs

INFORMATIONS FINANCIÈRES CONCERNANT LE PATRIMOINE LA SITUATION FINANCIÈRE ET LES RÉSULTATS RFA 20.1 Comptes consolidés du Groupe ADP au 31 décembre 2018 20.2 Rapport des

Grouper cette s´ erie en 10 classes de mˆ eme amplitude s’´ etalant sur [0, 10], utiliser la fonction dsearch pour savoir combien de valeurs sont dans chaque classe et enfin

• Les citoyens sont citoyens ` a vie et peuvent se porter candidats aux ´ elections annuelles pour devenir hauts fonc- tionnaires (1 sur 13) pour un mandat de 1 an ; au terme de

Reprenez le programme fait ` a l’exercice pr´ ec´ edent permettant de tracer les lignes de niveaux entre −3 et 3 de f.. Extrema

x simule ainsi une variable al´ eatoire suivant une loi binomiale de param` etres n et p..

Soit X une variable al´ eatoire suivant la loi de Bernoulli de param` etre p suppos´

« On ne force pas les professeurs ou les départements à passer à la formation en ligne [...] mais, de temps en temps, on leur rappelle que s'ils veulent se faire connaître,

Grâce à son support écran polyvalent et sa conception unique, le M/Flex fonctionne parfaitement et complète n’importe quel environnement de travail contemporain. Qu’il soit