Projets informatiques L3 EURIA
7 novembre 2017
Consignes :
— Travailler par groupe de 2 étudiants.
— Les soutenances dureront 15 minutes (10 minutes de présentation et 5 minutes de ques- tions). Elles auront lieu le jeudi 21/12/2017.
— Envoyer un compte rendu rapide (quelques lignes) par mail toutes les 15 jours. Ce compte rendu décrira les travaux effectués ainsi que les travaux prévus pour la quinzaine suivante.
— Le rapport (environ 4 pages) et les programmes commentés seront envoyés au plus tard le 19/12/2017 au format électronique aux adresses franck.vermet@univ-brest.fr, pierre.ailliot@univ- brest.fr.
1. Algorithmes de tri.
Le but de ce projet est d’implémenter et de comparer la complexité de différents algorithmes de tri classiques. On pourra suivre le plan de travail ci-dessous.
1. Comprendre et programmer dans R les algorithmes de tri classiques. On pourra commen- cer par les algorithmes référencés sur la page Wikipedia :
https ://fr.wikipedia.org/wiki/Algorithme_de_tri
2. Comparer les temps d’exécution des différents algorithmes avec R. On réalisera des tests sur différents vecteurs (par exemple obtenus par simulation) et on vérifiera qu’on retrouve la complexité théorique des différents algorithmes.
Le rapport sera rédigé en utilisant R Markdown.
2. Analyse de données spatialisées avec R
L’objectif de ce projet est d’analyser les données spatialisées de votre choix en utilisant R.
On pourra suivre le plan de travail ci-dessous.
1. Choisir un jeu de données spatialisées qui vous intéresse. Vous pouvez notamment consul- ter le sitehttps ://www.data.gouv.fr/fr/ qui contient de nombreux jeux de données ’open- data’. Les données devront comporter une composante spatiale et pouvoir se représenter
1
à l’aide de cartes. Quelques exemples de jeux de données spatialisées qui peuvent être intéressants pour des actuaires :
https ://www.data.gouv.fr/fr/reuses/accidents-de-la-route-dans-le-finistere-beta/
https ://www.data.gouv.fr/fr/reuses/carte-des-arretes-de-catastrophes-naturelles-de-2001- a-2010/
https ://www.data.gouv.fr/fr/datasets/esperance-de-vie-a-la-naissance-par-region-en-france/
2. Faire une analyse statistique du jeu de données choisi. En plus des statistiques descriptives classiques (résumés numériques et graphiques), vous réaliserez des cartes avec R pour représenter les données choisies.
Le rapport sera rédigé en utilisant R Markdown.
3. Algorithmes de classification supervisée décidant selon la majorité
Les méthodes d’apprentissage statistique sont de plus en plus utilisées en actuariat (détection de fraude, tarification, ....). L’objectif de ce projet est d’implémenter et de tester des algorithmes de classification supervisée décidant selon la majorité (voir document joint).
Les points suivants devront être traités :
— Implémentation en R des deux algorithmes présentés (avec ou sans noyau).
— Vérification expérimentale des performances des algorithmes sur des donnés simulées et sur des données réelles.
Remarque : l’étude mathématique des propriétés de ces algorihmes, présentées dans le docu- ment, n’est pas l’objet de ce projet.
4. Initiation à R-Shiny et applications aux données HMD.
L’objectif de ce projet est de vous initier à l’outil R-Shiny et d’implémenter une applica- tion permettant de visualiser des informations pertinentes à partir des données du site Human Mortality Database :
http ://www.mortality.org
L’outil R-Shiny permet de présenter dans un environnement graphique interactif des appli- cations dans un navigateur Internet. R-Shiny est le logiciel retenu par l’EURIA pour le dévelop- pement de sa plateforme de calcul actuariel.
Quelques liens utiles :
- http ://shiny.rstudio.com , pour apprendre à utiliser R-Shiny.
- http ://euria-lab.fr/
- http ://euria-lab.fr/apps/finance/fintabamt.html , pour voir ce qui a été réalisé l’an dernier par des étudiants de L3 EURIA.
2