• Aucun résultat trouvé

Feuille de Travaux Dirig´es n

N/A
N/A
Protected

Academic year: 2022

Partager "Feuille de Travaux Dirig´es n"

Copied!
5
0
0

Texte intégral

(1)

Mesures de liaison et variables qualitatives

Les exemples de cette feuille de travaux dirig´ees sont tir´es du livre A Handbook of Statistical Analyses Using R, de Brian S. Everitt and Torsten Hothorn, CRC Press 2007.

Exercice IX.1. Groupe sanguin et Rh´esus

Le tableau suivant donne la r´epartition de 10 000 personnes en fonction de leur groupe sanguin et de leur facteur Rh´esus.

O A B AB Total

Rh+ 3570 3825 935 170 8500 Rh 630 675 165 30 1500 Total 4200 4500 1100 200 10000

Les deux caract`eres, groupe sanguin et Rh´esus, sont-ils ind´ependants ?

1. ecup´erer les donn´ees dans R en ex´ecutant les instructions suivantes1.

> Chemin <- "C:\\..."

> Rhesus <- read.csv(paste(Chemin, "Rhesus.CSV", sep="")) Faire deRhesus, le jeu de donn´ees dont nous allons nous servir.

> attach(Rhesus)

2. erifiez que les donn´ees sont bien celles de l’´enonc´e.

> print(Rhesus)

O A B AB

1 3570 3825 935 170 2 630 675 165 30

Les noms des lignes ne sont pas les bons. La commande suivante permet de corriger ce d´efaut.

> dimnames(Rhesus)[[1]] <- c( "Rh´esus.+", "Rh´esus.-")

> print(Rhesus)

O A B AB

Rh´esus.+ 3570 3825 935 170 Rh´esus.- 630 675 165 30

> Rhesus <- as.table(as.matrix(Rhesus)) Repr´esenter graphiquement les donn´ees.

> plot(Rhesus,main="D´enombrements")

1. Il faut remplacer "C:\\..." par le r´epertoire dans lequel vous avez enregistr´e le fichier que vous souhaitez ouvrir.

(2)

Dénombrements

Rhésus.+ Rhésus.−

OABAB

3. Recalculer les marges du tableau de donn´ees.

> margin.table(Rhesus) [1] 10000

> margin.table(Rhesus,margin=1) Rh´esus.+ Rh´esus.-

8500 1500

> margin.table(Rhesus,margin=2)

O A B AB

4200 4500 1100 200

4. Peut-on r´ealiser un test duχ2 d’ind´ependance en utlisant les approximations classiques ? Dans l’affirmative, ex´ecuter l’instruction suivante.

> chisq.test(Rhesus,simulate.p.value = FALSE) Pearson's Chi-squared test

data: Rhesus

X-squared = 0, df = 3, p-value = 1

5. ealiser un test duχ2 d’ind´ependance version exacte bas´e sur la m´ethode de Monte-Carlo.

> chisq.test(Rhesus,simulate.p.value = TRUE, B = 50000)

Pearson's Chi-squared test with simulated p-value (based on 50000 replicates)

(3)

5. ealiser un test de Fisher exact classique.

> fisher.test(Rhesus)

Fisher's Exact Test for Count Data data: Rhesus

p-value = 1

alternative hypothesis: two.sided

5. ealiser un test de Fisher exact bas´e sur la m´ethode de Monte-Carlo.

> fisher.test(Rhesus,simulate.p.value = TRUE, B = 50000)

Fisher's Exact Test for Count Data with simulated p-value (based on 50000 replicates)

data: Rhesus p-value = 1

alternative hypothesis: two.sided

Exercice IX.2. Suicides.

Mann (1981) ´etablit un compte rendu d’une ´etude qui examine les causes d’un com- portement indiff´erent ou concern´e d’une foule lorsqu’une personne menace de se suicider en sautant du haut d’un immeuble. L’hypoth`ese que la foule s’int´eresse `a la personne est plus probable en p´eriode chaude. Mann (1981) classe 21 d´enombre- ments de tentative de suicide par deux facteurs, la p´eriode de l’ann´ee et si la foule est int´eress´ee ou non. Les donn´ees sont pr´esent´ees dans le tableau ci-dessous et la question est de savoir si ils ont raison d’invoquer cette hypoth`ese. Les donn´ees ve- nant de l’h´emisph`ere nord, la p´eriode Juin-Septembre repr´esente la p´eriode chaude.

Int´eress´ee Indiff´erente

Juin-Septembre 8 4

Octobre-Mai 2 7

1. T´el´echarger le fichier suicides du package HSAUR `a l’aide de l’instruction data(suicides,package="HSAUR")ou alors rentrer les donn´ees.

2. Afficher-le `a l’´ecran. Combien de lignes ? Combien de colonnes ? 3. Repr´esenter-le graphiquement.

(4)

Dénombrements

June−−September October−−May

BaitingNonbaiting

4. Peut-on envisager de faire un test duχ2? Les conditions sont-elles respect´ees ? Pour cela calculer le tableau des effectifs th´eoriques.

5. `A la vue des r´esultats obtenus ci-dessus, qu’envisagez-vous de faire pour r´e- pondre `a la question pos´ee ? En fait, quel test proposez-vous de r´ealiser ?

Exercice IX.3. On cherche `a savoir s’il existe une association entre la couleur des yeux, clairs ou fonc´es, et la couleur des cheveux, blonds ou bruns, chez les ˆetres humains. On consid`ere un groupe de 20 individus de sexe f´eminin ou masculin.

Cheveux\Yeux Clairs Fonc´es

Blonds 5 1

Bruns 0 14

La couleur des yeux est-elle ind´ependante de celle des cheveux ? Cr´eer, par exemple, le jeu de donn´ees `a l’aide de l’instruction suivante :

> cheveuxyeux <- as.table(matrix(c(5,1,0,14),byrow=T,nrow=2, dimnames = + list(c( "Blonds", "Bruns"), c("Clairs", "Fonc´es"))))

(5)

Blonds Bruns

ClairsFoncés

Références

Documents relatifs

J’observe toutefois (Figure 13.3) ` a la fin du mod` ele la formation d’une seconde paire de zones cisaillantes du cˆ ot´ e retro du mod` ele, ce qui laisse penser que la

Le seuil de satisfaction est le seuil au del` a duquel l’acteur est satisfait alors que la satisfaction est le niveau de satisfaction fi- nale de l’acteur ` a l’issue de la

Ecrire en Java la gestion d’un tas, repr´esent´e par un tableau : cr´eer, ins´erer, minimum, supprimer (le minimum), modifier une valeur.. Vous programmerez ceci en TP, et

Pour trouver les coordonn´ ees d’un point dans un rep` ere, on ´ ecrit l’´ equation (vectorielle) caract´ eristique on convertit cette ´ equation en syst` eme num´ erique on

On fixe une cat´ egorie C et on prend comme objets les couples (R, M ) d’une monade R sur C et d’un R-module M. Que peut-on prendre comme morphismes pour faire une cat´

Perdre ses photos de vacances : ¸ca n’a pas de

Programme des enseignements – Syst` emes d’information et conception d’entrepˆ ots de donn´ ees – Les principes et la d´ emarche du Data Mining (fouille de donn´ ees)

Objectifs : Maˆıtriser les structures de base de l’informatique (tableaux, listes, files, piles) et les op´ erations ´ el´ ementaires sur ces structures et introduction au