• Aucun résultat trouvé

Charger le hier de données irisdisponible dans lelogiiel R etdérire lesdonnées 2

N/A
N/A
Protected

Academic year: 2022

Partager "Charger le hier de données irisdisponible dans lelogiiel R etdérire lesdonnées 2"

Copied!
2
0
0

Texte intégral

(1)

TP2 : Représentations graphiques

Exerie 1: hier de données iris

Lehierde donnéesirisontientdesdonnées olletéesparEdgarAnderson, donnéesrelatives

à des mesures sur des plantes.

1. Charger le hier de données irisdisponible dans lelogiiel R etdérire lesdonnées

2. tapez les diérenes instrutions suivantes et identier le résultatobtenu:

iris

dim(iris)

names(iris)

str(iris)

iris$Petal.Length

iris$Speies

level(iris$Speies)

summary(iris$Speies)

table(iris$Speies)

3. Quelles sont les représentations graphiques obtenues par :

pie(table(iris$Speies))

barplot(table(iris$Speies))

Ces représentations sont-elles onformesà e que l'on souhaite?

Commentorriger éventuellement?

4. Deuxbotanistessesontégalementintéressésauxirisetontolletéslesdonnéessuivantes

:

olletion1<-rep(("setosa","versiolor","virginia"),(15,19,12))

olletion2<-rep(("setosa","versiolor","virginia"),(22,27,17))

Sur une même fenêtre graphique, représenter es deux nouvelles distributions et om-

menter.

5. Maintenant, ons'intéresse à latroisièmeolonne du hier.

Quelle est lanature de ette variable?

Quelle type de représentation graphiqueappropriée pourrait-on faire an de la résumer?

La faire.

6. Faire de même ave lestrois autres variables du hier

Exerie 2: Données brutes ou regroupement par lasses

On onsidère le jeu de données suivant, relatifau tauxd'hémoglobine dans le sang mesuré en

g/L hez des adultessupposés en bonne santé.

(2)

127 128 130 132 133 134 135 138 138 138

138 142 145 148 148 150 151 154 154 158

Hommes 141 144 146 148 149 150 150 151 153 153

153 154 155 156 156 160 160 160 163 164

164 165 166 168 168 170 172 172 176 179

1. Faire une représentation graphiqueadaptée de es données brutes.

2. A présent, on onsidère les lasses ]104; 114], ]114; 124], ]124; 134], ]134; 144], ]144; 154], ]154; 164],]164; 174],]174; 184].

Faire une représentation graphique prenant en ompte es lasses. Comparez ave e qui

préède.

3. Sur les données brutes puis sur les données regroupées, traer la ourbe des fréquenes

umulées.

Exerie 3: Inuene du nombre de lasses et du nombre de données

On onsidère lejeu de données donnees1.txt.

1. Charger e jeu de données dans le logiielR

2. Faire un histogramme de es données et omparer le résultat lorsque l'on augmente le

nombre de lasses. Que onstatez-vous?

3. Préleveraléatoirement500observationsdujeudedonnéesinitialetfairedemême. Constatez-

vous la mêmehose? Pourquoi?

Exerie 4: Fontion de répartition empirique

On onsidère de nouveau le jeu de données préédent.

1. Ononsidèredansun premiertempsleslassesdontlapluspetitelimitedelasseest -4.6,

laplus grande4.6etleslimitesintermédiairesétantlesélémentsd'unesuite arithmétique

de pas 0.5etde premierterme -4.6.

Traer la ourgedes fréquenesumulées assoiées à es lasses.

2. Fairedemêmeàpartirdeslassesdéniesparlafontionhistlorsquel'onforel'argument

breaks à valoir100.

3. Traer lafontionde répartitionF empiriquedéniesurun jeude données (xi)1inpar :

∀t ∈R, F(t) = 1 n

n

X

i=1

1xi≤t

1xit=

(1 sixi ≤t 0 sinon .

Que onstatez-vous?

Références

Documents relatifs

2020-01-D-16-fr-1 5 Le tableau ci-dessous indique la population scolaire de chaque école et la population scolaire totale de l’ensemble du système, année après année, pour

« Constitue un traitement de données à caractère personnel toute opération ou tout ensemble d'opérations portant sur de telles données, quel que soit le procédé utilisé,

La base de données (données primaires) est la matière première à partir de laquelle la bioinformatique va produire d'autres données (données secondaires) et

Nous pouvons enchaîner directement avec le composant d’apprentissage que nous allons chercher dans l’onglet CLASSIFY.. Nous ne modifions pas les paramètres du

Enfin, la zone TREE SEQUENCES indique l’évolution de la réduction de l’erreur RE (RE = 1 – R²) en fonction du nombre de feuilles de l’arbre, sur le fichier d’expansion

Si l’on devait faire un parallèle, il faudrait comparer ces valeurs avec ceux de l’ACP où on ne tenait pas compte de l’endogène pour élaborer les axes factoriels : nous

Nous introduisons maintenant le composant UNIVARIATE DISCRETE STAT (onglet STATISTICS) dans le diagramme, à la suite du DEFINE STATUS.. Nous activons menu VIEW pour accéder

Dernier sujet que nous aborderons dans ce didacticiel, nous voulons vérifier que dans un ménage, l’homme a tendance à avoir un salaire plus élevé que celui de la