• Aucun résultat trouvé

M I e e ()= ()= ⎛ ⎞ ⎛ ⎞ e 0.80.20.40.6 e 10000.60.4 A B ⎜ ⎟ ⎜ ⎟ e e ⎝ ⎠ ⎝ ⎠ ()= ⎛ ⎞ e 0.50.5 Π ⎜ ⎟ e ⎝ ⎠ €

N/A
N/A
Protected

Academic year: 2022

Partager "M I e e ()= ()= ⎛ ⎞ ⎛ ⎞ e 0.80.20.40.6 e 10000.60.4 A B ⎜ ⎟ ⎜ ⎟ e e ⎝ ⎠ ⎝ ⎠ ()= ⎛ ⎞ e 0.50.5 Π ⎜ ⎟ e ⎝ ⎠ €"

Copied!
2
0
0

Texte intégral

(1)

1/2 www.univ-paris13.fr

www-galilee.univ-paris13.fr

Villetaneuse Bobigny Saint-Denis Saint-Denis-La Plaine Argenteuil

       

 

NB : Les téléphones portables sont strictement interdits lors de l'épreuve. Ils doivent être éteints et rangés dans les sacs. Les supports de cours et des TD/TP sont autorisés. Les trois exercices sont indépendants.

EXERCICE 1 (∼20 mn) :

Dans une station météo, on s’intéresse à la modélisation de l’évolution du temps à partir d’observations journalières. Pour ce faire, on utilise un modèle de Markov λ1 à états finis. Les états correspondent à trois aspects du temps : e1 → Soleil, e2 → Pluie, et e3 → Nuage. La figure 1.a présente la structure du modèle stochastique λ1. Les valeurs sur les arcs correspondent aux probabilités des transitions entre états. Les trois états possèdent les mêmes probabilités initiales : π123=1/3.

Figure 1.a : Modèle λ1

e1 e2 Soleil Nuage Pluie

A

( ) λ

2 =ee1

2

0.8 0.2 0.4 0.6

⎛

⎝ ⎜ ⎞

⎠ ⎟ B

( ) λ

2 =ee1

2

1 0 0

0 0.6 0.4

⎛

⎝ ⎜ ⎞

⎠ ⎟

Π

( ) λ

2 =ee1

2

0.5 0.5

⎛

⎝ ⎜ ⎞

⎠ ⎟

Figure 1.b : Matrices des probabilités du Modèle λ2

1.1 Le modèle λ1 est-il observable ou caché ? Justifiez votre réponse.

1.2 Pour ce modèle λ1, donnez les matrices des probabilités de transition A(λ1) et d’émission B(λ1).

1.3 Soit « Soleil » le temps qu’il fait aujourd’hui.

Calculez la probabilité P(O/λ1, q1=e1) pour que le temps qu’il va faire les jours suivants soit : O=(Soleil, Soleil, Pluie, Pluie, Soleil, Nuage ).

1.4 On considère maintenant le modèle λ2(A, B, Π) dont les matrices des probabilités sont indiquées dans la figure 1.b. Dessinez le graphe de ce modèle en y indiquant les différentes probabilités.

1.5 Ce modèle est-il observable ou caché ? Justifiez votre réponse.

1.6 Calculez P(O/λ2, q1=e1), et comparez la avec P(O/λ1, q1=e1). Commentez.

1.7 Soit O’=(Nuage, Soleil, Pluie, Pluie, Soleil, Soleil).

Calculez les deux probabilités P(O’/λ1, q1=e1) et P(O’/λ2, q1=e1), et comparez les respectivement avec P(O/λ1, q1=e1) et P(O/λ2, q1=e1). Commentez.

1.8 Quel est le meilleur modèle pour ce problème de modélisation de l’évolution du temps ?

 

EXERCICE 2 (∼10 mn) :

On considère le problème de classement représenté par la figure 2.

2.1 Est ce que les deux classes de ce problème sont linéairement séparables ? Pourquoi ?

2.2 On propose des fonctions séparatrices de la famille des polynômes. La figure 2 présente 6 solutions indiquées avec un triplet (d°, εA, εT), où d° représente le degré du polynôme, εA : l’erreur d’apprentissage et εT : l’erreur en test. Laquelle, des 6 solutions, est la meilleure ? Pourquoi ?

2.3 La figure 2 montre un phénomène de surapprentissage (Overfitting). Expliquer brièvement ce phénomène.

2.4 A partir de quelle solution le phénomène

« Overfitting » a été observé sur la figure 2 ?

2.5 Que proposez vous pour remédier à ce phénomène ?

Figure 2

M

ASTER

I

NFORMATIQUE

Spécialités EID

2

& PLS

UE (TND) : Traitement Numérique des Données

Partiel du 12 décembre 2014 - Durée 2 heures Université Sorbonne Paris Cité

(2)

2/2 www.univ-paris13.fr

www-galilee.univ-paris13.fr

Villetaneuse Bobigny Saint-Denis Saint-Denis-La Plaine Argenteuil

EXERCICE 3 (∼60 mn) :

Le virus Ebola est classé parmi les agents infectieux les plus contagieux et les plus mortels au monde, d'après l'Organisation mondiale de la santé (OMS). Les premiers symptômes apparaissent entre 2 et 21 jours après la contamination.

On observe :

s1 : maux de tête et brusque montée de fièvre s2 : douleurs musculaires et abdominales s3 : toux et mal de gorge

s4 : diarrhées et vomissements

dont chacun peut prendre la valeur vrai : «1» ou faux : «0».

Nous considérons l'ensemble des données présentées dans le tableau 1, où la tâche consiste à prédire si une personne est malade ou non (c1 =malade, c2= sain). Nous utilisons une représentation basée sur les quatre symptômes par sujet pour décrire un patient.

Patient s1 s2 s3 s4 Etat (pi)

p1 1 1 1 0 c1

p2 1 0 0 0 c2

p3 0 0 1 1 c1

p4 0 1 1 0 c2

p5 0 0 0 0 c2

p6 1 1 0 0 c1

Tableau 1

3.1 Quelle est la dimension dim de l’espace d’entrée (espace de représentation/caractéristiques) ? 3.2 Quelles sont les classes de ce problème (les différentes catégories) ?

3.3 Fournissez la description d’un exemple dans cet échantillon.

3.4 Est-ce un échantillon d’apprentissage pour une tâche d’apprentissage supervisé ou non supervisé ? Et pourquoi ?

3.5 Compte tenu de l'ensemble des données dans le tableau 1, déterminez toutes les probabilités requises pour appliquer le classifieur Bayesien Naïf (CBN) afin de prédire si une personne est malade ou non :

Etat p ( )

i

= Arg max

ck{c1,c2}

P p (

i

/c

k

) P c ( )

k

{ } avec P p (

i

/c

k

) = P s (

j

/c

k

)

j=1 dim

3.6 Expliquez brièvement pourquoi ce classifieur Bayesien est dit « Naïf » ? 3.7 Vérifiez si le CBN classe correctement toutes les données du tableau 1.

3.8 Construire un arbre de décision (AD) en utilisant les données du tableau 1 et la fonction Gain basée sur l’entropie.

3.9 Vérifiez si l’AD classe correctement tous les exemples d'apprentissage du tableau 1.

3.10 Appliquez votre CBN et l’AD pour les sujets de test correspondant à ce qui suit (trouver l’état de chaque personne) :

a- un patient (p7) qui a des douleurs musculaires et abdominales, des diarrhées et des vomissements.

b- un patient (p8) qui a des maux de tête et brusque montée de fièvre, des diarrhées et des vomissements.

c- un patient (p9) qui a des maux de tête et brusque montée de fièvre, de la toux, un mal de gorge.

3.11 Calculez, sur les données du tableau 1, le rappel, la spécificité et la précision de chaque approche (CBN et AD).

3.12 Peut-on utiliser le rappel comme mesure de performance pour la sélection de la meilleure méthode ? Justifiez votre réponse.

3.13 Donnez une représentation graphique, dans un espace ROC, des performances des deux approches sur le problème de classement des données du tableau 1. Commentez le graphique.

Références

Documents relatifs

TABLE DES RACINES PRIMITIVES ET DES CARACTI~RES OUI S'Y RAPPORTENT POUR LES NOMBRES PREMIERS ENTRE.. 5000

L'ensemble des nombres entiers positifs n'est h i aussi originairement donn~ que comme >>classe>>.. CANTOR qui seraient infirmdes par ce travail: le

Die Bedeutung der Abel'sehen Abhandlung fiber die binomische Reihe. Die directe Behandlung und allgemeine LSsung der Aufgabe (III) finder man im

Ich babe im Folgenden die Frage behandelt, ob es mSglich ist, von der einfach herzustellenden Normalform einer nicht Singularen Substigution zu der einer

In FELIX KLEIZ~ Ober t~iemann's Theorie der Abel'schen IMegrale finden sieh wichtige Siitze tiber weitcrgehende Beziehungen dicser Art.. l~ber einige Gruudgebilde

D a n s votre travail r6cemment publiS: ))Grundlagen emer allgemeinen Mannichfaltigkeitslehre)), vous avez 6nonc6 le th~or~me suivant, qui me paralt devoir ~tre

« Cela nous a permis de créer une écriture architectu- rale propre à chaque entité qui présente des façades particulières, des variations dans les rapports entre les pleins et

la structure poteaux-poutres en béton du bâtiment est très simple : sur les cinq niveaux, neuf trames de 3,80 m dans la longueur (une par chambre large de 3,66 m), trois trames