• Aucun résultat trouvé

Axe MSA Bilan scientifique et perspectives

N/A
N/A
Protected

Academic year: 2022

Partager "Axe MSA Bilan scientifique et perspectives"

Copied!
30
0
0

Texte intégral

(1)

Axe MSA

Bilan scientifique et perspectives

ENSM.SE

L. Carraro - 17 décembre 07

(2)

Plan

 Compétences acquises

 domaines scientifiques

 compétences transverses

 Domaines ou activités accessibles :

 immédiatement

 au prix d’adaptations faciles

 via des efforts conséquents

 Conclusion

(3)

Cartographie (domaines scientifiques)

Complexité croissante

spatial

temporel

statique monodim

linéaire multidim

non linéaire multidim

(4)

Cartographie (domaines scientifiques)

Cours 1A

spatial

temporel

statique monodim

linéaire multidim

non linéaire multidim séries chros

anal. données plans exp.

régression

processus

proje t

(5)

Cartographie

Compétences transverses

 Questionnement sur un problème

– Compréhension

– Prise en compte du contexte, des contraintes – Rapport coût/qualité

 Communication

– écrite – orale

 Travail en groupe

(6)

Domaines ou activités

accessibles immédiatement

 Etudes de données expérimentales

 laboratoires (industrie, santé…)

 mise en évidence de facteurs importants

 service qualité

 Prévisions

 prévisions de vente ou de consommation

 finance, assurances

 prévisions de coûts

(7)

Domaines ou activités

accessibles immédiatement

 Aide à la décision

 construction d’indicateurs

 probabilisation de décisions

 sociétés de conseil (finance, risques…)

 Appui méthodologique à un autre domaine

 mécanique, matériaux

 procédés, environnement

 santé

(8)

Domaines ou activités accessibles facilement

 Statistical Process Control.

 Traitement statistique du signal.

 Séries temporelles multidimensionnelles, économétrie.

 Régression non linéaire.

 Méthodes non paramétriques en petite dimension.

(9)

Aller plus loin ?

Cours 1A séries chros

anal. données spatial

temporel

statique monodim

linéaire multidim

non linéaire multidim plans exp.

régression

processus

géostatistique linéaire géostatistique non linéaire

traitement du signal - filtrage analyse d’images

Apprentissage statistique : réseaux de neurones support vector machines

bagging, boosting calcul stochastique processus, champs de Markov

compression, ondelettes

(10)

Aller plus loin ?

Cours 1A séries chros

anal. données spatial

temporel

statique monodim

linéaire multidim

non linéaire multidim plans exp.

régression

processus

géostatistique linéaire géostatistique non linéaire

traitement du signal - filtrage analyse d’images

Apprentissage statistique : réseaux de neurones support vector machines

bagging, boosting calcul stochastique processus, champs de Markov

compression, ondelettes

(11)

Filtrage de Kalman et modèles d’état

 Modèle d’état :

équation d’état

équation d’observation Yn : vecteur p*1 observé au temps n

Xn : vecteur q*1 décrivant le système au temps n En, Fn : vecteurs de résidus aléatoires

 Modèle discret d’équation différentielle bruitée, avec mesure.

!

Xn = F Xn"1 + G#n

Yn = H Xn + Fn

(12)

Cas d’un ARMA(2,1)

!

Xn = xn

xn"1

#

$ % &

' ( , En = )n

)n"1

#

$ % &

' ( , Yn = xn

!

Xn = "1 "2 1 0

#

$ % &

' ( Xn)1 + 1 )*1 0 0

#

$ % &

' ( En Yn =

[

1 0

]

Xn

!

xn " #1 xn"1 " #2 xn"2 = $n " %1$n"1

(13)

Problèmes traités

 Filtrage :

E(Xn/Y1,…,Yn) = ?

 Prévision :

E(Xn+h/Y1,…,Yn) = ? Var(Xn+h/Y1,…,Yn) = ? Loi de Xn+h/Y1,…,Yn) = ?

 Algorithme de Kalman, valable en temps continu (ED stochastiques), non stationnaire.

 Applications innombrables aux pbs temps réel (cf.

aéronautique)

 Vers le contrôle…

(14)

Géostatistique

 Historique : exploitation minière (or)

 D. Krige, G. Matheron

 Modélisation de phénomènes spatiaux :

– Géométrie en 2D ou 3D (ou ND !) – Observations non régulières

 Observation d’une fonction y(x) en certains points x de l’espace.

 Objectif = prévoir y(x) pour des x non observés ou inobservables.

(15)

Modèle probabiliste

y(x) est supposé être la réalisation d’un processus gaussien Y(x) tel que :

γ est le (demi-) variogramme du processus Si Var(Y(x)) = σ2 :

!

E Y(x)

[ ]

= m

E Y(x

[ (

+ h) " Y(x)

)

2

]

= 2 #(h)

!

cov(Y(x),Y(x + h)) = "2 # $(h)

(16)

Lien variogramme-processus

(17)

Simulations en 2D

(18)

Simulations en 2D

(19)

Applications

Tous les domaines qui mettent en œuvre des variables spatiales non totalement

accessibles :

 Mines, pétrole, gaz

 Environnement

 Halieutique

 Computer experiments

 …

(20)

Estimation de la longueur

moyenne du hareng écossais

(21)

Carte au toit d’un champ

pétrolier

(22)

Vers l’apprentissage statistique

 Arbres de régression :

Principe :

– Première séparation :

Parmi tous les prédicteurs et tous les niveaux, trouver ceux qui séparent la réponse en deux groupes les plus hétérogènes (déviance)

– Séparations suivantes :

Recommencer dans chaque sous-groupe – Elagage de l’arbre

Remonter dans l’arbre et couper les branches homogènes.

(23)

Exemple : données de spam

 1 réponse qualitative : spam ou pas spam

 57 prédicteurs : fréquence d’apparition de caractères ou de mots.

 4601 observations

NB :

X. = ; X..3=!

X..1=( X..4=$

X..2=[ X..5=#

(24)

Arbre avant élagage

(25)

Arbre après élagage

(26)

Problèmes de stabilité

(27)

Modèles de ruine

 Origine : assurances sinistres, conception de barrages, fils d’attentes…

Réserve de risque Z(t)au temps t : Z(t) = x + βt - X(t)

– x = capital initial

β = taux (constant) de primes d’assurances entrantes – X(t) = montant des sinistres cumulé au temps t

!

X(t) = Xk

k=1 Nt

"

(28)

Hypothèses et premiers éléments

– (Nt)t est un processus de Poisson homogène d’intensité λ

– Les variables Xk sont i.i.d. d’espérance µ Et par suite :

Donc on doit avoir

!

E(X(t) /Nt) = µNt

!

E(Z(t)) = x + "t # $µt

!

" > #µ

(29)

Vers la théorie de la ruine

Explicitation du lien entre x et P(T<+ ∞ )

T = instant de ruine = Inf{t, Z(t)<0}

Difficulté du problème :

 Théorique (voir martingales)

 Numérique (processus à sauts)

 Introduction de la réassurance…

(30)

Conclusion

 Axe MSA = des bases solides

 Compléments méthodologiques :

 option maths applis

 finance, assurance

 autres…

 Compléments applicatifs :

 tous domaines

Références

Documents relatifs

We compare support vector regression (SVR) with a committee regression technique (bagging) based on regression trees and ridge regression done in feature space.. On the basis of

A common approach is to t the data with the parametric model and train the non- parametric add{on on the errors of the parametric part, i.e. t the nonparametric part to the errors.

Prenons un deuxième problème, qui comme le calcul d'une moyenne, peut être décrit dans le formalisme mathématique, mais offre une réelle difficulté: l'analyse d'un tableau

Choix de la s´eparation: hyperplan qui classifie correctement les donn´ees (lorsque c’est possible) et qui se trouve “le plus loin possible de tous les exemples”..

— Tout algorithme pouvant s’exprimer à partir de produits scalaires peut bénéficier du coup du noyau en vue d’une extension au cas non-linéaire. — Grâce au coup du noyau,

EPAT’14, Carry-Le-Rouet 7-12 juin 2014 Apprentissage par réseaux de neurones artificiels / Younès Bennani (LIPN-Univ. Paris 13) 7.. Le

– Breiman, random forests, machine learning 2001, (fourth rank top cited paper). – Breiman, bagging predictors, machine learning

LASVM-I uses the Ramp function as a filtering mechanism to discard the outliers during online iterations. In online learning settings, we can discard new coming training