• Aucun résultat trouvé

Mesuresdeliaisonetvariablesqualitatives FeuilledeTravauxDirig´esn 9 o

N/A
N/A
Protected

Academic year: 2022

Partager "Mesuresdeliaisonetvariablesqualitatives FeuilledeTravauxDirig´esn 9 o"

Copied!
4
0
0

Texte intégral

(1)

Fr´ed´eric Bertrand & Myriam Maumy Master 1re ann´ee - 2016/2017

Feuille de Travaux Dirig´ es n

o

9 Mesures de liaison et variables qualitatives

Les exemples de cette feuille de travaux dirig´ees sont tir´es du livre A Handbook of Statistical Analyses Using R, de Brian S. Everitt and Torsten Hothorn, CRC Press 2007.

Exercice IX.1. Groupe sanguin et Rh´esus

Le tableau suivant donne la r´epartition de 10 000 personnes en fonction de leur groupe sanguin et de leur facteur Rh´esus.

O A B AB Total

Rh+ 3570 3825 935 170 8500 Rh 630 675 165 30 1500 Total 4200 4500 1100 200 10000

Les deux caract`eres, groupe sanguin et Rh´esus, sont-ils ind´ependants ?

1. ecup´erer les donn´ees dans R en ex´ecutant les instructions suivantes1.

> Chemin <- "C:\\..."

> Rhesus <- read.csv(paste(Chemin, "Rhesus.CSV", sep = "")) Faire deRhesus, le jeu de donn´ees dont nous allons nous servir.

> attach(Rhesus)

2. erifiez que les donn´ees sont bien celles de l’´enonc´e.

> print(Rhesus)

Les noms des lignes ne sont pas les bons. La commande suivante permet de corriger ce d´efaut.

> dimnames(Rhesus)[[1]] <- c("Rh´esus.+", "Rh´esus.-")

> print(Rhesus)

> Rhesus <- as.table(as.matrix(Rhesus)) Repr´esenter graphiquement les donn´ees.

> plot(Rhesus, main = "D´enombrements")

1. Il faut remplacer "C:\\..." par le r´epertoire dans lequel vous avez enregistr´e le fichier que vous souhaitez ouvrir.

1

(2)

Fr´ed´eric Bertrand & Myriam Maumy Master 1re ann´ee - 2016/2017

Dénombrements

Rhésus.+ Rhésus.−

OABAB

3. Recalculer les marges du tableau de donn´ees.

> margin.table(Rhesus)

> margin.table(Rhesus, margin = 1)

> margin.table(Rhesus, margin = 2)

4. Peut-on r´ealiser un test duχ2 d’ind´ependance en utlisant les approximations classiques ? Dans l’affirmative, ex´ecuter l’instruction suivante.

> chisq.test(Rhesus, simulate.p.value = FALSE)

5. ealiser un test duχ2 d’ind´ependance version exacte bas´e sur la m´ethode de Monte-Carlo.

> chisq.test(Rhesus, simulate.p.value = TRUE, B = 50000) 5. ealiser un test de Fisher exact classique.

> fisher.test(Rhesus)

5. ealiser un test de Fisher exact bas´e sur la m´ethode de Monte-Carlo.

> fisher.test(Rhesus, simulate.p.value = TRUE, B = 50000)

Exercice IX.2. Suicides.

Mann (1981) ´etablit un compte rendu d’une ´etude qui examine les causes d’un com- portement indiff´erent ou concern´e d’une foule lorsqu’une personne menace de se suicider en sautant du haut d’un immeuble. L’hypoth`ese que la foule s’int´eresse `a la personne est plus probable en p´eriode chaude. Mann (1981) classe 21 d´enombre- ments de tentative de suicide par deux facteurs, la p´eriode de l’ann´ee et si la foule

2

(3)

Fr´ed´eric Bertrand & Myriam Maumy Master 1re ann´ee - 2016/2017

est int´eress´ee ou non. Les donn´ees sont pr´esent´ees dans le tableau ci-dessous et la question est de savoir si ils ont raison d’invoquer cette hypoth`ese. Les donn´ees ve- nant de l’h´emisph`ere nord, la p´eriode Juin-Septembre repr´esente la p´eriode chaude.

Int´eress´ee Indiff´erente

Juin-Septembre 8 4

Octobre-Mai 2 7

1. T´el´echarger le fichier suicides du package HSAUR `a l’aide de l’instruction data(suicides,package="HSAUR")ou alors rentrer les donn´ees.

2. Afficher-le `a l’´ecran. Combien de lignes ? Combien de colonnes ? 3. Repr´esenter-le graphiquement.

Dénombrements

June−−September October−−May

BaitingNonbaiting

4. Peut-on envisager de faire un test duχ2? Les conditions sont-elles respect´ees ? Pour cela calculer le tableau des effectifs th´eoriques.

5. `A la vue des r´esultats obtenus ci-dessus, qu’envisagez-vous de faire pour r´e- pondre `a la question pos´ee ? En fait, quel test proposez-vous de r´ealiser ?

3

(4)

Fr´ed´eric Bertrand & Myriam Maumy Master 1re ann´ee - 2016/2017

Exercice IX.3. On cherche `a savoir s’il existe une association entre la couleur des yeux, clairs ou fonc´es, et la couleur des cheveux, blonds ou bruns, chez les ˆetres humains. On consid`ere un groupe de 20 individus de sexe f´eminin ou masculin.

Cheveux\Yeux Clairs Fonc´es

Blonds 5 1

Bruns 0 14

La couleur des yeux est-elle ind´ependante de celle des cheveux ? Cr´eer, par exemple, le jeu de donn´ees `a l’aide de l’instruction suivante :

> cheveuxyeux <- as.table(matrix(c(5, 1, 0, 14), byrow = T, + nrow = 2, dimnames = list(c("Blonds", "Bruns"),

+ c("Clairs", "Fonc´es"))))

Dénombrements

Blonds Bruns

ClairsFoncés

4

Références

Documents relatifs

Le package dans R permettant d’obtenir la densit´ e, les quantiles ou de g´ en´ erer des r´ ealisations de lois normales multivari´ ees est le package mvtnorm?. Que font

Maintenant la valeur T obs de la r´ ealisation de la statistique observ´ ee pour les donn´ ees originales non m´ elang´ ees peut ˆ etre compar´ ee avec la distribution de T

Il pourrait donc ˆ etre int´ eres- sant de r´ ealiser des graphiques diff´ erents pour chacune des modalit´ es Iris se- tosa, Iris Versicolor et Iris Virginica ou de

Dans le cas d’une variable quantitative discr` ete, le nombre de valeurs possibles (ou modalit´ es) est fini et vous pouvez r´ esumer ces donn´ ees sous la forme d’un tableau de

&gt; loc &lt;- stars(USJudge, labels = NULL, scale = FALSE, + radius = FALSE, frame.plot = TRUE, key.loc =

Maintenant la valeur de la r´ ealisation de la statistique observ´ ee pour les donn´ ees originales non m´ elang´ ees peut ˆ etre compar´ ee avec la distribution de la statistique

4. R´ ealiser le test de Fisher au seuil de significativit´ e 5% puis de 1%. Dans le cas de cette ´ etude, est-il possible de proc´ eder ` a des comparaisons multiples ? Pourquoi ?

Bien que les valeurs avec lesquelles nous avons ´ etabli le mod` ele soient ´ eloign´ ees de la valeur de 31˚F, et que de ce fait la probabilit´ e de l’apparition d’au moins une