• Aucun résultat trouvé

Mesuresdeliaison FeuilledeTravauxDirig´esn 8 o

N/A
N/A
Protected

Academic year: 2022

Partager "Mesuresdeliaison FeuilledeTravauxDirig´esn 8 o"

Copied!
3
0
0

Texte intégral

(1)

Fr´ed´eric Bertrand & Myriam Maumy Master 1`ere ann´ee - 2008/2009

Feuille de Travaux Dirig´ es n

o

8 Mesures de liaison

Exercice VIII.1. Densit´e de lois normales bivari´ees

Le package dans R permettant d’obtenir la densit´e, les quantiles ou de g´en´erer des ealisations de lois normales multivari´ees est le package mvtnorm.

Que font les instructions suivantes ?

> library(mvtnorm)

> help(package="mvtnorm")

> dmvnorm(c(0,0), c(0,0), diag(2), log=FALSE)

Nous allons maintenant repr´esenter graphiquement la fonction de densit´e de deux lois normales bivari´ees.

Executer les instructions suivantes et identifier leur action. En particulier il faudra´ eterminer `a quoi servent les fonctionsc(), cbind(), diag(),matrix()?

library(lattice)

# N2(c(0,0),I_2)

> g <- expand.grid(x = seq(-2,2,0.05), y = seq(-2,2,0.05))

> g$z <- dmvnorm(x=cbind(g$x,g$y),mean=c(0,0), sigma=diag(2), + log=FALSE)

> wireframe(z ~ x * y, data = g,colorkey = TRUE,drape=TRUE)

# N2(c(0,0),matrix(c(1,0.75,0.75,1),byrow=T,nrow=2))

> var <- matrix(c(1,0.75,0.75,1),byrow=T,nrow=2)

> g <- expand.grid(x = seq(-2,2,0.05), y = seq(-2,2,0.05))

> g$z <- dmvnorm(x=cbind(g$x,g$y),mean=c(0,0), sigma=var, log=FALSE)

> wireframe(z ~ x * y, data = g,colorkey = TRUE,drape=TRUE)

Les graphiques pr´ec´edents sont statiques. Le package rgl permet de r´em´edier `a ce efaut et de faire pivoter les graphiques `a l’aide de la souris.

library(rgl)

# N2(c(0,0),matrix(c(1,0,0,1),byrow=T,nrow=2))

> g <- expand.grid(x = seq(-4,4,0.05), y = seq(-4,4,0.05))

> g$z <- dmvnorm(x=cbind(g$x,g$y),mean=c(0,0), sigma=diag(2), + log=FALSE)

> g2z <- matrix(g$z*5000,byrow=T,nrow=length(seq(-4,4,0.05))) 1

(2)

Fr´ed´eric Bertrand & Myriam Maumy Master 1`ere ann´ee - 2008/2009

> g2x <- 10 * (1:nrow(g2z))

> g2y <- 10 * (1:ncol(g2z))

> zlim <- range(g2y)

> zlen <- zlim[2] - zlim[1] + 1

> colorlut <- terrain.colors(zlen) # height color lookup table

> col <- colorlut[ g2y-zlim[1]+1 ] # assign colors to heights for each point

> open3d()

> surface3d(g2x, g2y, g2z, color=col, back="lines")

# N2(c(0,0),matrix(c(1,0.75,0.75,1),byrow=T,nrow=2))

> g <- expand.grid(x = seq(-4,4,0.05), y = seq(-4,4,0.05))

> g$z <- dmvnorm(x=cbind(g$x,g$y),mean=c(0,0),

+ sigma=matrix(c(1,0.75,0.75,1), byrow=T,nrow=2), log=FALSE)

> g2z <- matrix(g$z*5000,byrow=T,nrow=length(seq(-4,4,0.05)))

> g2x <- 10 * (1:nrow(g2z))

> g2y <- 10 * (1:ncol(g2z))

> zlim <- range(g2y)

> zlen <- zlim[2] - zlim[1] + 1

> colorlut <- terrain.colors(zlen) # height color lookup table

> col <- colorlut[ g2y-zlim[1]+1 ] # assign colors to heights for each point

> open3d()

> surface3d(g2x, g2y, g2z, color=col, back="lines")

Exercice VIII.2. BMI, poids et taille.

Nous disposons de trois variables continues r´eelles.

Le BMI X1.

Le poids1 X2.

La tailleX3.

Le BMI d’un individu est un indice qui se calcule `a partir de la taille et du poids

1D’un poids de vue physique, il s’agit de la masse.

2

(3)

Fr´ed´eric Bertrand & Myriam Maumy Master 1`ere ann´ee - 2008/2009

par la formule suivante :

BMI = Weight Height2 o`u le poids s’exprime en kg et la taille en m.

L’´echantillon ´etudi´e a un effectif n = 38 et est exclusivement constitu´e d’individus de sexe f´eminin. Les donn´ees sont disponibles dans le fichier BMI.CSV. R´ecup´erer les donn´ees dans R dans un objet appel´e BMIdata.

1. Repr´esenter graphiquement les donn´ees `a l’aide de la fonction plot.

2. Calculer les coefficients de corr´elation de Pearson, Spearman et Kendall en utli- sant les commandes suivantes :

attach(BMIdata)

cor(BMIdata,method="pearson") cor(BMIdata,method="spearman") cor(BMIdata,method="kendall")

3. Quelle hypoth`ese doit ˆetre v´erifi´ee pour pouvoir tester la nullit´e des coefficients de corr´elation de Pearson ? Tester cette hypoth`ese avec la fonction mardia de la biblioth`eque dprepqu’il faudra sans doute t´el´echarger depuis Internet :

library(dprep)

mardia(cbind(BMIdata[1:2],rep(1,nrow(BMIdata)))) mardia(cbind(BMIdata[2:3],rep(1,nrow(BMIdata)))) mardia(cbind(BMIdata[1:3],rep(1,nrow(BMIdata)))) 4. Commenter les commandes suivantes :

cor.test(BMI,Weight,data=BMIdata,method="pearson") cor.test(Height,Weight,data=BMIdata,method="pearson")

cor.test(BMI,Height,data=BMIdata,method="spearman",exact=TRUE) cor.test(BMI,Height,data=BMIdata,method="kendall",exact=TRUE) library(coin)

spearman_test(BMI ~ Height, distribution = approximate(B = 10000)) library(agricolae)

(pearsoncor <- correlation(BMIdata,BMIdata,method="pearson")) (spearcor <- correlation(BMIdata,BMIdata,method="spearman")) (kendallcor <- correlation(BMIdata,BMIdata,method="kendall"))

4. Calculer les coefficients de d´etermination multiples de chacune des variables par rapport aux deux autres.

5. Calculer les coefficients de d´etermination partiels de chaque couple de vaiables par rapport `a la troisi`eme.

Exercice VIII.3. ´Ecole

Les donn´ees sont celles de l’exemple du cours. Elles sont disponibles dans le fichier Ecole.CSV.

Etudier la liaison entre les diff´´ erentes variables du jeu de donn´ees.

3

Références

Documents relatifs

Dans le cas d’une variable quantitative discr` ete, le nombre de valeurs possibles (ou modalit´ es) est fini et vous pouvez r´ esumer ces donn´ ees sous la forme d’un tableau de

&gt; loc &lt;- stars(USJudge, labels = NULL, scale = FALSE, + radius = FALSE, frame.plot = TRUE, key.loc =

Si nous ne tenons pas compte du nombre d’instructions, quelle valeur pour- rions-nous utiliser comme estimation du temps moyen de programmation des projets.. Quelle

On cherche l’effet de deux incentive stimulus sur la capacit´ e d’un personne ` a r´ esoudre deux probl` emes de nature diff´ erente.. L’ordre dans lequel on a fait r´ esoudre

Bien que les valeurs avec lesquelles nous avons ´ etabli le mod` ele soient ´ eloign´ ees de la valeur de 31˚F, et que de ce fait la probabilit´ e de l’apparition d’au moins une

Aquitaine Auvergne Bourgogne Bretagne Centre Cham−Ard Corse Fr−Comte Ile de Fr Lang−Rous Limousin Lorraine Midi−Pyr Nord−PdC Basse−Nor Haute−Nor Pays−Loire

Obtenir la classification des hˆ otels en trois groupes ` a l’aide de la m´ ethode des K−moyennes qui portera sur les coordonn´ ees des hˆ otels dans le premier plan

Pour repr´ esenter sur un mˆ eme graphique l’intervalle de confiance d’une valeur liss´ ee et l’intervalle de confiance d’une pr´ evision, nous calculons ces intervalles