• Aucun résultat trouvé

UNIVERSITE DE BRETAGNE OCCIDENTALE

N/A
N/A
Protected

Academic year: 2022

Partager "UNIVERSITE DE BRETAGNE OCCIDENTALE"

Copied!
1
0
0

Texte intégral

(1)

UNIVERSITE DE BRETAGNE OCCIDENTALE

Année 2019-2020

EURIA 1ère année

Examen à distance du jeudi 28 mai 2020.

Durée : 1 heure

Vous devez rendre trois fichiers à la fin de l’examen :

1. une copie manuscrite scannée ou photographiée au format .pdf pour l’exercice 1, 2. un fichier .Rmd pour l’exercice 2,

3. le fichier .pdf associé au fichier .Rmd.

Exercice 1 Cet exercice est à faire sur la copie, mais on pourra utiliser R pour les applications numériques.

La matrice de covarianceV d’un jeu de données estV =

4 1 1 1 2 1 1 1 3

1. Quelle est la matrice de corrélation ?

2. Quelles sont les vecteurs principaux de l’ACP ? 3. Quel est le sous-espace principal de dimension 2 ?

4. Quel est le pourcentage d’inertie totale expliquée par le premier plan principal ?

Exercice 2 Cet exercice est à faire en utilisant R Markdown. On rendra le fichier .Rmd et le fichier .pdf associé à la fin de l’examen.

On considère dans cet exercice le jeu de donnéesswiss disponible dansR. On pourra créer un data.frame nomméz qui contient les données en tapant la commandez=swiss. La

commande?swiss permet d’obtenir un descriptif du jeu de données. Il contient, pour chaque canton suisse en 1888, les variables suivantes

— "Fertility" : taux de fertilité normalisé ;

— "Agriculture" : pourcentage de la population qui travaille dans le domaine agricole ;

— "Examination" : le pourcentage d’appelés au service militaire qui a obtenu une bonne note aux évaluations réalisées par l’armée ;

— "Education" : le pourcentage de la population qui a continué ses études après l’école primaire

— "Catholic" : le pourcentage de catholique dans la population

— "Infant.Mortality" : taux de décès chez les enfants de moins de 1 an.

Ce jeu de données intéresse les démographes pour analyser les raisons qui ont conduit à une réduction du taux de natalité dans les pays occidentaux avec le développement économique.

1. Réaliser une ACP sur le jeu de données. La question est volontairement libre : vous pouvez utiliser tous les outils vus dans le chapitre sur l’ACP. La notation portera sur la pertinence des outils utilisés et sur l’interprétation que vous ferez des résultats obtenus. Les

interprétations et les codes R utilisés devront apparaître dans le fichier .Rmd.

2. Réaliser une classification non-supervisée. La question est volontairement libre : vous pouvez utiliser tous les outils vus dans le chapitre sur la classification. La notation portera sur la pertinence des outils utilisés et sur l’interprétation que vous ferez des résultats obtenus. Les interprétations et les codes R utilisés devront apparaître dans le fichier .Rmd.

1

Références

Documents relatifs

Sans utiliser une boucle, créer deux objets de type data.frame avec 6 colonnes, nommés swiss1 et swiss2, qui contiennent respectivement les données des cantons pour lesquels la

La conjecture de Syracuse est l’hypothèse selon laquelle la suite de Syracuse associée à n’importe quelle valeur initiale a atteint la valeur 1 à partir d’un certain rang..

Ecrire une boucle for qui détermine le maximum d’un vecteur V ainsi que le nombre d’occurrences et les positions du maximum (dans cette question, on n’utilisera pas la fonction min

Donner une estimation de la prime a posteriori pour les 5 assurés du tableau à l’aide du modèle de crédibilité linéaire (modèle de Bühlmann).. On rappellera rapidement (en

Donner une estimation de la prime pour l’année 6 pour les 7 assurés du tableau à l’aide du modèle de crédibilité linéaire (modèle de Bühlmann)?. Quel est la valeur du facteur

Analyser la série temporelle de vent avec la méthode POT et comparer avec les résultats obtenus avec ceux des questions précédentes.. Exercice 3 On considère la série temporelle

Analyser la série temporelle avec la méthode POT et comparer avec les résultats obtenus avec ceux des questions précédentes4. Exercice 3 On considère la série temporelle des

(b) Donner une estimation de la température centenale ainsi qu’un intervalle de confiance à 95% pour cette quantité en utilisant la méthode des maxima par blocs puis la méthode