• Aucun résultat trouvé

Devoir maison du mercredi 2 octobre 2012 : Énoncé

N/A
N/A
Protected

Academic year: 2022

Partager "Devoir maison du mercredi 2 octobre 2012 : Énoncé"

Copied!
3
0
0

Texte intégral

(1)

Devoir maison du mercredi 2 octobre 2012 : Énoncé

Taper sous R

library(car) data(Mroz) Mroz

fix(Mroz) help(Mroz)

qui charge les données Mroz, les affiche et affiche leur descriptif. À partir de là, produire un court rapport (format PDF) contenant :

1. Description des données

Un bref descriptif des données, rédigé en français, et contenant (a minima) la population, sa taille, les variables, leurs types.

2. Script de préparation des données

Un script de préparation des données contenant :

• les lignes de code permettant de recoder les variables lfp, wc et hc en français ;

• les lignes de code permettant de créer une nouvelle variable contenant le nombre d’enfants.

Enfin, sauver les données :

save(Mroz,file="Mroz.rda")

et tenir à ma disposition ce fichier également.

(2)

Devoir maison du mercredi 2 octobre 2012 : Corrigé

1 Description des données

Les données Mroz contiennent des informations collectées sur une population de 753 femmes mariées et publiées dans l'article (Mroz, 1987). Les mesures de 8 variables sont disponibles :

lfp est une variable qualitative nominale à deux niveaux (« oui » et « non ») qui indique si la femme est active (ie : travaille) ;

k5 est une variable quantitative discrète qui compte le nombre d'enfants de moins de 5 ans de la femme ;

k618 est une variable quantitative discrète qui compte le nombre d'enfants âgés de 6 à 18 ans de la femme ;

age est une variable quantitative discrète qui indique l'âge de la femme ;

wc est une variable qualitative nominale à deux niveaux (« oui » et « non ») qui indique si la femme a suivi une formation universitaire ;

hc est une variable qualitative nominale à deux niveaux (« oui » et « non ») qui indique si son mari a suivi une formation universitaire ;

lwg est une variable quantitative continue qui contient le logarithme du taux de rémunération de la femme. Si la femme ne travaille pas, cette variable est estimée à partir par une régression à partir des autres variables ;

inc est une variable quantitative continue qui contient le revenu familial à l'exception des revenus provenant de la femme.

2 Nettoyage des données

Les lignes de code suivantes permettent de recoder les variables lfp, wc et hc en français : de manière plus précise, « yes » est recodé en « oui » et « no » en « non » :

Mroz$lfp <- factor(Mroz$lfp, labels=c("non","oui")) Mroz$wc <- factor(Mroz$wc, labels=c("non","oui")) Mroz$hc <- factor(Mroz$hc, labels=c("non","oui"))

La ligne de code suivante permet de créer une nouvelle variable, « nbchildren », contenant le nombre total d'enfants de chaque femme (ie : la somme du nombre d'enfants de moins de 5 ans et du nombre d'enfants entre 6 et 18 ans) :

Mroz$nbchildren <- Mroz$k5+Mroz$k618

Références

Mroz, T. A. (1987) The sensitivity of an empirical model of married women's hours of work to economic and statistical assumptions. Econometrica, 55, 765-799.

(3)

Devoir maison du mercredi 2 octobre 2012 : Barème

1 Description des données

Phrase rédigée décrivant la population et sa taille : /1

Phrases rédigées décrivant les variables et leurs types : / 3 (-1 par erreur)

2 Nettoyage des données

Recodage des données : / 2 (0,5 seulement si le recodage est fait dans le mauvais sens ; -1 par ligne de code manquante)

Nouvelle variable : / 2 Fichier rda correct : / 1

Total : / 9

Références

Documents relatifs

• On considère une expérience aléatoire qui consiste en une succession de n épreuves indépendantes, chacune d’entre elles ayant deux issues : succès obtenu avec probabilité p

On utilise beaucoup Geogebra pour l’étude de la statistique à deux variables, alors que cette application nous permet de le faire pour une variable.. Puisque l’on utilise la

On reprend les même exemples qu’au I ; calculer les espérances des deux variables aléatoires définies Exemple 1 ​à compléter à la maison au crayon à

La microlithiase alvéolaire est une affection très rare, autosomique récessive dans environ la moitié des cas et liée à des mutations du gène SLC34A2.. Généralement

On considère la même succession d’épreuves de Bernoulli qu’avant, cette fois-ci, on se donne une infinité dénombrable de tirage, et on note X le numéro du premier succès

La répartition des femmes selon le fait qu'elles aient, ou non suivi des études universitaires est donné dans le tableau et la figure ci-dessous. Études

En particulier, on étudiera la concentration des revenus et on repérera la présence d'une variable aberrante et on effectuera l'analyse avec et sans cette

La distribution du travail des femmes conditionnellement à leur niveau d'études de leurs conjoints est donnée dans le tableau et le graphique ci-dessous :. Études universitaires