• Aucun résultat trouvé

Série 3 : Statistique

N/A
N/A
Protected

Academic year: 2022

Partager "Série 3 : Statistique"

Copied!
3
0
0

Texte intégral

(1)

Université Mohammed V Faculté des sciences -Rabat Département de Mathématiques

Licence d’Excellence en Génomique Module Mathématiques 2 Année universitaire 2018-2019

Série 3 : Statistique

Exercice 1.(DL) Indiquer de quel type sont les variables présentées ci-dessous : (qualitatives, quanti- tatives discrètes ou quantitatives continues).

1. L’état-civil des habitants du Maroc.

2. La taille des étudiants de l’université de Rabat.

3. Le nombre de pages d’un support de cours.

4. Les professions reconnues au Maroc.

5. Le nombre de ventes d’un appareil électroménager.

6. Le nombre d’accidents non-professionnels.

7. Le nombre d’enfants dans une famille.

8. Le sexe des élevés d’une classe secondaire.

9. La nationalité des élevés d’une classe.

10. Le poids d’un nouveau né.

11. Le nombre de télévisions par famille.

12. Le degré de qualification du personnel d’une entreprise.

13. La couleur des yeux des étudiants de l’université de Rabat.

14. Le nombre de jours de pluie pendant le mois d’août.

Exercice 2. Pour chaque ensemble de données ci-dessous :

— Nombre de jours de chômage pour 40 personnes. 180 10 30 50 420 30 180 360 200 30 360 120 500 200 30 420 360 370 360 150 180 280 30 500 180 720 420 180 40 500 120 180 194 400 30 360 40 400 180 200.

— Qualité de production de 30 produits : D = défectueux Q = de bonne qualité. Q D Q D Q Q Q Q Q Q D Q Q D Q D D Q Q Q D D D Q Q Q Q Q Q D.

1. Définir la population, la variable puis préciser ses modalités.

2. Déterminer de quel type de variables il s’agit.

Exercice 3. On considère la série statistique 2, 3, 4, 4, 5, 6, 7, 9.

1. Calculer la moyenne.

2. Calculer la variance et l’écart type.

Exercice 4. On considère deux variables quantitative x et y mesurées sur une même population de taille n. On définit la covariance entre xet y parCov(x, y) = n1Pk=n

k=1(xk−¯x)(yky) et le coefficient¯ de corrélation parCor(x, y) = Cov(x,y)σ

xσy . On pose a = Cov(x,y)σ2

x , b = ¯ya¯xet by =ax+b. L’expression by=ax+b s’appelle la droite de régression (ou de moindres carrées) dey surx;y, la valeur ajustée (oub prédite) dey;a, la pente ;b, la réponse à l’origine ; etyk−byk, l’erreur d’ajustement.

1. (a) Vérifier que la covariance est symétrique.

(b) Montrer que Cov(x, y) = n1Pk=n

k=1xkyk¯y.

2. Considérons une population de 10 fonctionnaires. Soitxle nombre d’années de service etyle nombre de jours d’absence pour raison de maladie.

xk 2 14 16 8 13 20 24 7 5 11 yk 3 13 17 12 10 8 20 7 2 8 (a) Représentez le nuage de points.

(b) Calculer ¯x,V ar(x), ¯y etV ar(y).

(c) CalculerCov(x, y) et Cor(x, y).

(d) Calculer la pente et la réponse à l’origine de la droite de régression dey surx.

(e) En déduire l’équation de la droite de régression dey surx.

1

(2)

Université Mohammed V Faculté des sciences -Rabat Département de Mathématiques

Licence d’Excellence en Génomique Module Mathématiques 2 Année universitaire 2018-2019

(f) Calculer les valeurs ajustées dey.

(g) Calculer les erreurs d’ajustement et vérifier que leur somme est nulle.

(h) On donne la valeur x11= 22. Donner ˆy11, la valeur prédite par la droite de régression.

Exercice 5. En vue de réaliser un programme de rééducation, des chercheurs ont soumis un questionnaire de neuropsychologie cognitive à 150 enfants dyslexiques tirés au sort. Le questionnaire comporte 20 questions et les chercheurs ont recueilli pour chaque enfant dyslexique le nombrexi de bonnes réponses.

Les résultats ainsi récoltés sont tels que : Σxi= 1502 et Σx2i = 19486.

1. Donner une estimation ponctuelle du nombre moyen de bonnes réponses et de son écart-type.

2. Donner un intervalle de confiance au niveau 99% pour nombre moyen de bonnes réponses.

Exercice 6.(DL) Dans un questionnaire sur les troubles obsessionnels du comportement, le score obtenu chez les adultes dépressifs a pour moyenne 84 avec un écart-type de 35. On s’intéresse aux scores moyens observés dans les échantillons de taille 49.

1. Identifier la population, la variable et son/ses paramètre(s).

2. Caractériser la distribution de la moyenne empirique.

3. Quelle est la probabilité d’observer sur un échantillon de taille 49 un score moyen inférieur à 90 ? 4. En dessous de quelle valeur se trouvent 95% des scores moyens observés sur les échantillons ? 5. Au dessus de quelle valeur se trouvent 95% des scores moyens observés sur les échantillons ? 6. Pour quelle proportion d’échantillons observe-t-on un score moyen compris entre les deux valeurs

déterminées aux questions 4 et 5 ?

Exercice 7. Le staff médical d’une institution publique fait des statistiques sur le taux de cholestérol (TC) de ses fonctionnaires, les observations sur 100 individus sont comme suit.

TC 120 160 200 240 280 320

Effectif 9 22 25 21 16 7

1. Calculer la moyenne et l’écart-type de l’échantillon.

2. Estimer la moyenne et l’écart-type pour le taux de cholestérol dans toute l’institution.

3. Donner un intervalle de confiance (IC) pour la moyenne au seuil 95%.

4. Déterminer la taille minimale d’échantillon pour que l’amplitude de l’IC soit inférieure à 10.

Exercice 8.(DL) Dans un atelier une machine fabrique des pièces en grande série ; on s’intéresse à leur longueur mesurée en cm et dont on admet qu’elle suit une loi normale de moyenne µ et d’écart type σ= 0,14. Afin de contrôler le fait que la moyenneµdes longueurs des pièces produites est 150 cm, on se propose de construire un test d’hypothèse. On a prélève des échantillons aléatoires de 49 pièces et on a obtenu une moyenne observée dex= 149,9.On noteX = X1+...X49 49 la variable aléatoire représentant la moyenne de cet échantillon.

1. Formuler l’hypothèse nulleH0et l’hypothèse alternative est H1. 2. Donner une estimation ponctuelle deµX et de σX.

3. Calculer le rapport critiqueRC=x−µσ X

X

.

4. Annoncer la règle de décision pour les niveaux de confiances 10%, 5% et 2%.

Exercice 9. On a pesé le raisin sur 10 souches prises au hasard dans une vigne et on a obtenu les résultats suivants en kilogrammes : 2,4 ; 3,2 ; 3,6 ; 4,1 ; 4,3 ; 4,7 ; 5,3 ; 5,4 ; 6,5 ; 6,9.

1. Calculer la masse moyenne et l’écart type de cet échantillon.

2. Estimer la variance de la population dont ont été extraites ces souches.

3. Donner un intervalle de confiance de la moyenne de la population au risque de 0,05.

4. Peut-on accepter l’hypothèse que le poids moyen de raisin est supérieur à 4,5 kg, au risque 10%, 5%, et 2% ?

2

(3)

Université Mohammed V Faculté des sciences -Rabat Département de Mathématiques

Licence d’Excellence en Génomique Module Mathématiques 2 Année universitaire 2018-2019

Exercice 10. Le temps d’incubation moyen pour le développement d’un anticorps est de 13 jours.

On souhaite expérimenter un traitement que l’on administre à 10 cobayes afin de diminuer ce temps d’incubation (considéré comme une variable gaussienne). Les temps d’incubation observés sont : 5 11 10 13 10 8 9 9 12 12. L’action du traitement est-elle significative au seuil 5% ?

Exercice 11.(DL) Un sondage a été effectué auprès de deux échantillons des jeunes pour déterminer le temps passé quotidiennement sur leur téléphone portable. Les résultats sont donnés dans le tableau ci-dessous. On note X1 et X2 les variables aléatoires représentant les moyennes respectives des deux échantillons.

Temps (en mn) [0 ;20[ [20 ;40[ [40 ;60[ [60 ;120[

Age [14 ;18[ 18 72 45 3

Age [18 ;22[ 15 55 37 9

1. Identifiern1 etn2 les tailles de deux échantillons.

2. Calculer les moyennesx1 etx2et les écart types1 ets2 des deux échantillons.

3. Formuler l’hypothèse nulleH0et l’hypothèse alternative est H1. 4. Donner la loi de la variable aléatoireX1X2.

5. Calculer le rapport critiqueRC=σx1−x2

X1−X2

.

6. Peut-on dire que le temps moyen passé par les 18-22 ans est plus important que celui des 14-18 ans, au seuil de 8 % ? au seuil de 5 % ?

7. Peut-on considérer au seuil de 5%, que le temps passé par les 18-22 ans suit une loi normale ? Exercice 12. Un test de quotient intellectuel (QI) réalisé auprès de 200 enfants a donné la répartition suivante :

QI [75 ;85[ [85 ;95[ [95 ;105[ [105 ;115[ [115 ;125[

Effectifs 4 51 88 47 10

1. Calculer la moyenne et l’écart-type empiriques de l’échantillon.

2. La distribution peut-elle être ajustée par une loi normale au seuil 5% ?

Exercice 13. Une enquête sur la répartition des groupes sanguins en fonction du sexe a donnée les résultats suivants :

A B AB O

H 51 12 6 50

F 38 6 5 32

1. Calculer les distributions marginales.

2. Faire un test d’indépendance au seuil 5% pour déterminer si la répartition des groupes sanguins est indépendante du sexe.

Exercice 14.(DL) La répartition d’un groupe d’étudiants poursuivant leurs études après le Baccalauréat est donnée dans le tableau suivant :

Destination Bac Sciences économiques Sciences expérimentales Sciences mathématiques

Licence Professionnelle 10 16 4

Licence Générale 10 15 5

École d’ingénieurs 12 14 10

Peut-on considérer au seuil 5% qu’il y a une indépendance entre lien entre le type de bac et la destination de la poursuite d’études ?

3

Références

Documents relatifs

On cherche ` a d´ eterminer un intervalle de confiance pour p au niveau de confiance 99% (1% de risque) 1.. Je pense donc que oui.. a) D i est la diff´ erence du nombre de p` eche

3.. Pour cela, il fait un sondage de 1000 clients, dont le résultat est le suivant : 80 sondés veulent choisir le premier forfait, 220 sondés – le deuxième, 330 sondés –

paramètre θ à l’aide d’un estimateur sans biais de θ Soit X une v.a.r... Ainsi, une marge d’erreur faible produit un niveau de risque élevé et un niveau de

Il s'agit d'une suite de 100 intervalles de confiance au niveau de confiance 0,95, dont chacun a été calculé sur un échantillon de taille 1000 simulé à partir de ce que fut le score

Pour cela, elle souhaite obtenir, à partir d’un échantillon aléatoire, une estimation de la proportion de clients satisfaits au niveau 0,95 avec un intervalle de confiance

Il s'agit d'une suite de 100 intervalles de confiance au niveau de confiance 0,95, dont chacun a été calculé sur un échantillon de taille 1000 simulé à partir de ce que fut le score

R: tr è è s bon transfert Joystick vers marche s bon transfert Joystick vers marche Plus difficile dans l. Plus difficile dans l ’ ’

Donner un intervalle de fluctuation au seuil de 95% de la fr´ equence de personnes satisfaits de la qualit´ e des produits commercialis´ es par son entreprise2. Parmi les