• Aucun résultat trouvé

1) Déterminer la moyenne et l’écart-type de cette série statistique.

N/A
N/A
Protected

Academic year: 2022

Partager "1) Déterminer la moyenne et l’écart-type de cette série statistique."

Copied!
9
0
0

Texte intégral

(1)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 1 TD 4 : Statistiques - Corrigé

Exercice 1 : La puissance fiscale des voitures d’une grande entreprise se répartit de la façon suivante :

1) Déterminer la moyenne et l’écart-type de cette série statistique. ̅ == 5,46875 = − 5,46875 ≈ 1,7115 et ≈ 1,308

2) Déterminer la médiane et les quartiles puis le premier et le 9ème décile.

= 5, = 5, = 6, = 4 = 7

3) Préciser l’étendue : 9 − 4 = 5, les intervalles interquartiles [5; 6] et interdéciles [4; 7] de cette série.

4) Préciser le mode de cette série statistique. 5

Exercice 2 :

Une machine conditionne des paquets d’additif pour ciment. On a prélevé aléatoirement 80 sachets sortis de cette machine la même matinée, et mesuré leur masse en grammes. Les résultats

intermédiaires vous sont fournis ainsi :

∑ %&& = 79 891 ; ∑ %&& = 79 856 983 ; min() = 926 ; max() = 1093 1) Dans cette expérience, quelle est la population échantillonnée ?

L’ensemble de la production.

2) Calculez à partir des informations données, la moyenne, la variance et l'écart-type des poids dans l’échantillon.

̅ =∑ %&&

' =79 891

80 = 998,6375 ( )*+ =∑ %&&

' − ̅ =79 856 983

80 − 998,6375 = 935,41 )*+ = ,935,41 ≈ 30,858 (

Puissance

fiscale (CV) Effectif Fréquence ni xi ni(xi)² FCC

4 5 6 7 8 9

39 57 35 15 7 7

0,24375 0,35625 0,21875 0,09375 0,04375 0,04375

156 285 210 105 56 63

624 1425 1260 735 448 567

0,24375 0,6 0,81875

0,9125 0,95625

1

TOTAL : 160 1 875 5 059

(2)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 2 3) On vous donne ensuite les données ainsi regroupées en classes :

Classes Effectifs ni amplitude de la classe ai fi Fi hi = fi/ ai

[926 ; 955g[ 7 955-926 = 29 7/80 = 0,0875 0,0875 0,00302

[955 ; 970[ 5 15 0,0625 0,15 0,0042

[970 ; 985[ 14 15 0,175 0,325 0,0117

[985 ; 1000[ 15 15 0,1875 0,5125 0,0125

[1000 ; 1015[ 12 15 0,15 0,6625 0,0100

[1015 ; 1030[ 14 15 0,175 0,8375 0,0117

[1030 ; 1055[ 11 25 0,1375 0,975 0,0055

1055 ou plus… 2 1093-1055 = 38 0,025 1 0,0007

3.1- 3.1- Représentez graphiquement ces données à l’aide d’un histogramme.

HISTOGRAMME AVEC CLASSES D’AMPLITUDES INEGALES :

3.2- Déterminer la classe modale et les quartiles dans ces données.

CLASSE MODALE = [985 ;1000[

QUARTILES DETERMINES PAR INTERPOLATION LINEAIRE : Q1/4 = 970 +15 ,- ,

, ≃ 978,57 ( Q1/2 = 985+15 ,- ,

, = 999(

Q3/4 = 1015+15 ,- ,

, = 1022,5 (

3.3- Que pouvez-vous conclure des positions respectives des indicateurs mode, médiane, moyenne ? Ils sont proches. La distribution est plutôt symétrique.

900 950 1000 1050 1100

MASSE DES SACHETS EN GRAMMES 5%

(3)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 3 Exercice 3 :

Le tableau suivant donne la dépense, en millions d’euros, des ménages en produits informatiques (matériels, logiciels, réparations) de 2007 à 2015.

Année 2007 2008 2009 2010 2011 2012 2013 2014 2015

Rang de l’année xi 0 1 2 3 4 5 6 7 8

Dépense yi 398 451 423 501 673 956 1077 1255 1427 1. Représenter le nuage de points associé à la série statistique (xi ; yi).

2. a) Écrire une équation de la droite d’ajustement affine D de y en x par la méthode des moindres carrés (les coefficients seront arrondis à 10-3). Représenter D dans le repère précédent.

On obtient 0 = 138,18 + 242,93

b) En utilisant cet ajustement affine, donner une estimation de la dépense des ménages (arrondie à un million d’euros) en produits informatiques en 2017 (rang 10)

0 = 138,18 × 10 + 242,93 ≈ 1 625

On estime à 1 milliard 625 millions la dépense des ménages en 2017.

3. L’allure du nuage permet d’envisager un ajustement exponentiel.

On pose zi = ln yi.

a) Recopier et compléter le tableau suivant où zi est arrondi à 10-3 :

xi 0 1 2 3 4 5 6 7 8

zi 5,986 6,111 6,047 6,217 6,512 6,863 6,982 7,135 7,263

y = 138,18x + 242,93

0 200 400 600 800 1000 1200 1400 1600

0 1 2 3 4 5 6 7 8 9

(4)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 4 b) Écrire une équation de la droite d’ajustement affine de z en x par la méthode des moindres carrés (les coefficients seront arrondis à 10-3).

D’après Excel, on obtient 3 = 0,1782 + 5,4992

c) En utilisant cet ajustement, donner une estimation de la dépense des ménages (arrondie à un million d’euros) en produits informatiques en 2017.

3 = 0,1782 × 10 + 5,8556 = or 3 = ln 0 donc 0 = ,≈ 2 075

4. En 2017, les ménages ont dépensé 68,9 milliards d’euros pour la culture, les loisirs et les sports et 3,1% de ces dépenses concernent les produits informatiques.

68,9 × 3,1

100 = 2,1359 milliards = 2 136 millions

Avec lequel des deux ajustements l’estimation faite est-elle la meilleure ?

Il est clair que la meilleure estimation est celle provenant de l’ajustement exponentiel.

Exercice 4 : Le but du problème est de déterminer le prix d’équilibre d’un produit. (On rappelle que le prix d’équilibre d’un produit est obtenu lorsque l’offre et la demande sont égales.) Une étude faite sur un produit a donné les résultats suivants (le prix au kilogramme est exprimé en euros et les quantités offre et demande sont exprimées en milliers de kilogrammes).

Prix proposé xi 0,30 0,35 0,45 0,65 0,80 1 Demande yi 6,25 4,90 3,75 2,75 2,40 2,25

Offre zi 1,25 1,30 1,30 1,50 1,55 1,60

Tous les résultats numériques seront donnés en valeur décimale arrondies à 10-2 près.

1. Représenter sur un même graphique les nuages de points associés respectivement aux séries statistiques (xi ; yi) et (xi ; zi).

0 1 2 3 4 5 6 7

0 0,2 0,4 0,6 0,8 1 1,2

Demande yi Offre zi

(5)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 5 2. Étude de la demande

La forme du nuage de points associé à la série (xi ; yi) permet d’envisager un ajustement exponentiel de y en x. On pose donc Yi = ln yi.

a) Donner une équation de la droite des moindres carrés du nuage de points associé à la série (xi ; Yi).

On obtient la droite d’équation = = −1,414 + 2,077

b) En déduire, en utilisant l’égalité Y = ln y, une estimation de la demande y en fonction du prix x au kilogramme.

ln 0 = −1,414 + 2,077 ⇔ 0 = -,??@A, = , × -,??@ ≈ 7,98 × 0,243@ 3. Étude de l’offre

La forme du nuage de points associé à la série (xi ; zi) permet d’envisager un ajustement affine.

Donner une équation de la droite des moindres carrés du nuage de points associé à cette série (xi ; zi).

On obtient la droite d’équation 3 = 0,5326 + 1,1015 4. Étude graphique du prix d’équilibre

On considère, dans la suite du problème, que la demande et l’offre sont respectivement formalisées par les fonctions f et g définies sur l’intervalle [0;2] par : B)+ = -,?@ A , et ()+ = 0,53 + 1,1. a) Déterminer le sens de variation de la fonction f sur l’intervalle [0 ; 2] et dresser son tableau de variation.

B est décroissante (dérivée négative)

b) Sur le graphique du 1., tracer les courbes représentatives des fonctions f et g.

c) Déterminer graphiquement le prix d’équilibre du produit.

Le prix d’équilibre est de 1,10 €.

(6)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 6 Exercice 5 :

Un intervalle de confiance à 99 % pour la moyenne de la population est [122 ; 130]. Si la moyenne de l’échantillon vaut ̅ = 126 et l’écart type de l’échantillon vaut = 16,07, quelle est la taille de

l’échantillon utilisé dans cette étude ?

Un intervalle de confiance à 99 % pour la moyenne est de la forme C −D×,√F ; +D×,√F G Ainsi, 126 −D×,√F = 122 et 126 +D×,√F = 130 et donc D×,

√F = 4 Enfin, √% =D×,? = , ×,? ≈ 10,345 et donc % = 108

Exercice 6 :

Un site de paris en ligne propose de miser sur les chances de la France de gagner la coupe du monde de rugby en 2023.

a) Un étudiant a interrogé 50 étudiants de l’IUT. 12 d’entre eux pensent que la France va gagner.

Donner un intervalle de confiance à 90 % de la proportion des français intéressés par le rugby pronostiquant la France gagnante.

La proportion dans l’échantillon est de H == 0,24

Un intervalle de confiance à 90 % est de la forme IH −,?×,J)-J+√F ; H +,?×,J)-J+√F K On remplace alors H par 0,24 et % par 50 :

C0,24 −,?×√ ,?× , ; H +,?×√ ,?× , G = [0,1796 ; 0,3004].

b) Connaissant le biais introduit par l’environnement sportif de l’IUT, notre étudiant préfère

interroger ses « amis » sur Facebook. Sur les 120 retours obtenus, seulement 9 croient que la France peut gagner. Donnez un intervalle de confiance à 98 % de la proportion des français intéressés par le football pronostiquant la France gagnante.

La proportion dans l’échantillon est de H = = 0,075

Un intervalle de confiance à 98 % est de la forme IH −,×,J)-J+√F ; H +,×,J)-J+√F K On remplace alors H par 0,075 et % par 120 :

C0,075 −,×√ , × , ; 0,075 +,×√ , × , G = [0,0189 ; 0,1311].

c) 3 jours plus tard, bien qu’il se vante de posséder plusieurs milliers d’amis, il n’obtient au total que 250 réponses sur lesquelles 30 ont confiance dans la victoire des bleus. Donnez un intervalle de confiance à 95 % de la proportion précédente.

La proportion dans l’échantillon est de H = = 0,12

Un intervalle de confiance à 95 % est de la forme IH −,×,J)-J+√F ; H +,×,J)-J+√F K On remplace alors H par 0,12 et % par 250 :

C0,12 −,×√ ,× , ; 0,12 +,×√ ,× , G = [0,0797 ; 0,1603].

(7)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 7 d) A partir de ces derniers résultats il décide d’attendre encore quelques jours avant de parier.

Combien de réponses doit-il attendre s’il veut obtenir un résultat à 3 % près, toujours avec un coefficient de confiance de 0,95 ?

Obtenir un résultat à 3 % près signifie une amplitude de 0,03 et donc une marge d’erreur de 0,015.

On cherche alors % tel que ,×√ ,× ,

√F = 0,015 ⇔ √% = 1,96 ×√ ,× , , ≈ 42,4616 On obtient alors % = 1803

Il doit attendre la réponse de 1803 amis.

Exercice 7 :

Le ministère des transports a publié le nombre de kilomètres effectués par jour en voiture par des habitants de métropole.

On dispose d’un échantillon de taille % = 15. Distance effectuée par jour en km :

20 22 23 19 15 14 17 21 10 15 12 18 18 16 21

1) Donner une estimation de la moyenne de la population.

̅ =20 + 22 + 23 + ⋯ + 21

15 = 17,4

2) Donner une estimation de l’écart type de la population.

=20+ 22+ 23+ ⋯ + 21

15 − 17,4 = 13,1733 = ,13,1733 ≈ 3,63

3) Construire un intervalle de confiance de niveau 95 % pour la moyenne de la population.

Un intervalle de confiance à 95 % pour la moyenne est de la forme C −D×,√F ; +D×,√F G En remplaçant par 17,4, par 3,63 et n par 15, on obtient :

C17,4 −,×, ; 17,4 +,×, G = [15,56 ; 19,24].

4) Supposons que l’on souhaite estimer le nombre moyen de kilomètres avec une amplitude de 2 km au niveau de confiance de 95 %.

Est-ce que ces données fournissent le niveau de précision souhaité ? si non que recommanderiez- vous ?

L’amplitude de notre intervalle de confiance est de 19,24 − 15,56 = 3,68 > 2 Une amplitude de 2 km correspond à une marge d’erreur de 1 :

D×,

√F = 1 ⇔ √% = 3,63 × 1,96 = 7,1148 ⇔ % ≈ 51

Il faudrait un échantillon de 51 pour atteindre cette marge d’erreur.

(8)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 8 Exercice 8 :

Une enquête IPSOS menée du 12 au 22 Mai 2015 pour le compte du Crédit Agricole auprès de citoyens européens comporte une série de questions sur l’économie collaborative.

A la question : « Au cours des 5 dernières années, avez-vous emprunté plus souvent qu’auparavant des biens que vous ne possédez pas ? », voici la répartition des réponses dans quatre pays :

Réponse Pays

Total Allemagne France Espagne Italie Grande-Bretagne

OUI 180 340 380 290 220 1410

NON 820 660 620 710 780 3590

Total 1000 1000 1000 1000 1000 5000

Exemple de lecture de ce tableau : parmi les 1000 Français interrogés, 340 ont répondu « Oui » à la question.

1) Calculer les effectifs théoriques sous l’hypothèse que la proportion de personnes ayant emprunté des biens « plus souvent » soit la même dans tous les pays.

Réponse

Pays

Total

Allemagne France Espagne Italie Grande-

Bretagne OUI

1000 × 1410 5000

= 282

1000 × 1410 5000

= 282

1000 × 1410 5000

= 282

1000 × 1410 5000

= 282

1000 × 1410 5000

= 282

1410

NON

1000 × 3590 5000

= 718

1000 × 3590 5000

= 718

1000 × 3590 5000

= 718

1000 × 3590 5000

= 718

1000 × 3590 5000

= 718

3590

Total 1000 1000 1000 1000 1000 5000

2) À partir du tableau et de la question 1), calculer le χ².

N = )282 − 180+

282 +)282 − 340+

282 + ⋯ +)282 − 220+

282 +)718 − 820+

718 + ⋯ +)780 − 820+

718

= 134,73

3) Répondre à la question « l’augmentation de la fréquence des emprunts de biens diffère-t-elle entre les cinq pays ? ».

OOP = )2 − 1+ × )5 − 1+ = 4

On choisit un seuil de signification de 1 %.

La valeur critique N , ,? = 13,2767 est largement inférieure au N. On rejette alors l’hypothèse d’indépendance Q .

L’hypothèse alternative Q de dépendance des deux variables est donc validée : on conclut donc que la fréquence des emprunts de biens diffère entre les cinq pays.

Notre observation initiale sur la base de l’échantillon est donc probablement vraie à l’extérieur de l’échantillon (avec cependant 1 % de risques de nous tromper).

(9)

FA Vaz – DUT GEA CHAM1 – M 31 07 – TD 4 corrigé Page 9 Exercice 9 :

A B O AB Total

RS 126 × 100300 = 42 30 × 100

300 = 10 105 × 100

300 = 35 39 × 100

300 = 13 100 RT 126 × 100300 = 42 30 × 100

300 = 10 105 × 100

300 = 35 39 × 100

300 = 13 100 RU 126 × 100300 = 42 30 × 100

300 = 10 105 × 100

300 = 35 39 × 100

300 = 13 100

Total 126 30 105 39 300

N = )42 − 50+

42 +)42 − 42+

42 +)42 − 34+

42 + ⋯ +)13 − 2+

13 +)13 − 16+

13 +)13 − 21+

13 ≈ 19,856 OP = )3 − 1+ × )4 − 1+ = 6

On choisit un seuil de signification de 1 %.

La valeur critique N , , = 16,8119 est inférieure au N. On rejette alors l’hypothèse d’indépendance Q .

L’hypothèse alternative Q de dépendance des deux variables est donc validée : on conclut donc que le type de groupe sanguin diffère entre les trois pays.

Exercice 10 :

présence d’effet(s)

secondaire(s) absence d’effet secondaire Total

princeps 12 × 200

1000 = 2,4 988 × 200

1000 = 197,6 200

générique 12 × 800

1000 = 9,6 988 × 800

1000 = 790,4 800

Total 12 988 1000

N = )2.4 − 2+

2.4 +)197.6 − 198+

197.6 +)9.6 − 10+

9.6 +)790.4 − 790+

790.4 ≈ 0,0843 OP = )2 − 1+ × )2 − 1+ = 1

On choisit un seuil de signification de 1 %.

La valeur critique N , , = 6,6349 est largement supérieure au N. On accepte alors l’hypothèse d’indépendance Q .

On conclut donc que la présence ou l’absence d’effets secondaires ne dépend pas du type de médicament.

Notre observation initiale sur la base de l’échantillon est donc probablement vraie à l’extérieur de l’échantillon (avec cependant 1 % de risque de nous tromper).

Notre observation initiale sur la base de l’échantillon est donc probablement vraie à l’extérieur de l’échantillon (avec cependant 1 % de risque de nous tromper).

Références

Documents relatifs

• Le troisième quartile Q 3 est la plus petite valeur pour laquelle on atteint ou dépasse 75% ; Exemple Imaginons que l’on ait le tableau statistique suivant :.. Valeurs 3 5 6 8 11

[r]

Définition Le premier quartile est la plus petite valeur du caractère notée Q 1 qui fait atteindre ou dépasser le quart des effectifs cummulés croissants.. Le troisième quartile est

Définition Le premier quartile est la plus petite valeur du caractère notée Q 1 qui fait atteindre ou dépasser le quart des effectifs cumulés croissants. Le troisième quartile est

De plus, la dispersion de la variable aléatoire moyenne diminue au fur et à mesure que la taille de

Quel est le nombre moyen de bonnes réponses données par les candidats de 24 ans et

Calcule la moyenne pondérée de chacune des séries statistiques suivantes (arrondis au dixième si

La moyenne générale sur vingt d’Alexis sur les trois trimestres est : 15 ; 12