• Aucun résultat trouvé

Fiche TP 05 : Analyse de donn´ees

N/A
N/A
Protected

Academic year: 2022

Partager "Fiche TP 05 : Analyse de donn´ees"

Copied!
1
0
0

Texte intégral

(1)

Fiche TP 05 : Analyse de donn´ees

Master 1 informatique 2019-2020

Exercice 1 : Meilleur sous-espace

Le fichier hc 3.dat contient les performances obtenues par la recherche locale hill-climbing first- improvement pour les 60 sous-espaces possibles synchronisant 3 cellules (voir projet). Le descriptif de ce fichier est donn´e dans README.txt.

Le but de l’exercice est de savoir quel est le sous-espace le plus performant.

Questions :

0 - Lire le fichier et enregistrer les donn´ees dans un data frame (cf.read.table)

a - Calculer pour chaque sou-espace la performance moyenne et enregistrer le r´esultat dans un data frame (utilisersummaryBysi possible).

b - Rep´erer les 3 sous-espaces les plus performants en moyenne.

c - Observer les distributions des performances pour ces 3 sous-espaces.

d - R´ealiser un test statistique pour montrer que les moyennes sont ou non significativement diff´erentes.

e - Conclure.

Exercice 2 : Corr´ elation

Le fichier rnd 3.dat contient le r´esultat de l’´echantillonnage de chaque sous-espace de mani`ere al´eatoire. Le descriptif de ce fichier est donn´e dans README.txt.

Le but de l’exercice est de savoir si cet ´echantillonnage al´eatoire est corr´el´e avec les performances du hill-climber.

Questions :

a - Quelles sont les mesures possibles de corr´elation ? b - Existe-t-il une diff´erence entre corr´elation et causalit´e ?

c - Apr`es la lecture du fichierrnd 3.dat dans un data frame, ajouter une colonne qui correspond

`

a la performance moyenne du hill-climber.

d - Tracer et calculer les diff´erentes corr´elations entre les variables ”interessantes” (voirpairs, ou ggpairsde la librairie GGally).

e - Calculer le mod`ele lin´eaire entre les performances du hill-climber et le ou les variables vous semble pertinentes.

f - Conclure.

1

Références

Documents relatifs

Pour revenir `a notre ´etude, `a partir de chaque mod`ele propos´e dans le paragraphe pr´ec´edent, nous pouvons rechercher les g`enes diff´erentiellement exprim´es entre les

Repr´ esentez graphiquement ` a l’aide du graphique ad´ equat les variables qualitatives de la table dans une mˆ eme fenˆ etre graphique.. Retrouvez les informations contenues

Dans un certain nombre de cas, R n’a pas possibilit´ e de donner le type correct d’une variable : il n’a aucun moyen d’identifier les variables ordonn´ ees (il les prend pour

Dans cette partie, l'unité de longueur est le Centimètre et l'unité d’aire est le centimètre carré.. Un rectangle ABCD est tel que AB = 5 et AD

Pour tester si les observations suivent une loi donn´ ee, pour comparer des moyennes, pour comparer des taux, si les observations sont issues d’une mˆ eme distribution, etc...

c - Comparer de nouveau, ` a l’aide d’un test statistique, les moyennes des 4 s´ eries de donn´ ees ` a partir de sous-´ echantillons al´ eatoires de taille 30. Exercice 4 :

Pour tester si les observations suivent une loi donn´ ee, pour comparer des moyennes, pour comparer des taux, si les observations sont issues d’une mˆ eme distribution, etc...

b - Le fichier ruban-3 initial final.csv contient la longueur de la trajectoire suivie par la pro- cession au d´ ebut (lorsque la tˆ ete atteint le point d’arriv´ e) et ` a la fin de