• Aucun résultat trouvé

Chaînes de Markov : une initiation INFO1 - Semaine 22 Guillaume CONNAN

N/A
N/A
Protected

Academic year: 2022

Partager "Chaînes de Markov : une initiation INFO1 - Semaine 22 Guillaume CONNAN"

Copied!
60
0
0

Texte intégral

(1)

Chaînes de Markov : une initiation

INFO1 - Semaine 22

Guillaume CONNAN

IUT de Nantes - Dpt d'informatique

Dernière mise à jour : 30 mai 2012

(2)

Sommaire

1 Vision dynamique des probabilités - Automates

Découverte

Premier exemple - Règles de parcours Deuxième exemple - Valeur moyenne 2 Comportement asymptotique des chaînes de

Markov

(3)
(4)

Sommaire

1 Vision dynamique des probabilités - Automates

Découverte

Premier exemple - Règles de parcours Deuxième exemple - Valeur moyenne 2 Comportement asymptotique des chaînes de

Markov

(5)

Sommaire

1 Vision dynamique des probabilités - Automates

Découverte

Premier exemple - Règles de parcours Deuxième exemple - Valeur moyenne 2 Comportement asymptotique des chaînes de

Markov

(6)

Les boules dans l'urne, deux tirages successifs sans remise...

(7)

i p ij j

Le présent contient toutes les données du passé...

(8)

i p ij j

Le présent contient toutes les données du passé...

(9)

Sommaire

1 Vision dynamique des probabilités - Automates

Découverte

Premier exemple - Règles de parcours Deuxième exemple - Valeur moyenne 2 Comportement asymptotique des chaînes de

Markov

(10)
(11)
(12)
(13)

état absorbant bord

états intérieurs chaîne absorbante

parcours (promenade) aléatoire

longueur d'un parcours

(14)

état absorbant bord

états intérieurs chaîne absorbante

parcours (promenade) aléatoire

longueur d'un parcours

(15)

état absorbant bord

états intérieurs chaîne absorbante

parcours (promenade) aléatoire

longueur d'un parcours

(16)

état absorbant bord

états intérieurs chaîne absorbante

parcours (promenade) aléatoire

longueur d'un parcours

(17)

état absorbant bord

états intérieurs chaîne absorbante

parcours (promenade) aléatoire

longueur d'un parcours

(18)

état absorbant bord

états intérieurs chaîne absorbante

parcours (promenade) aléatoire

longueur d'un parcours

(19)

Les règles

1

la probabilité de réaliser un parcours donné à partir d'un point donné est égale au produit de toutes les probabilités de transition le long de ce parcours ;

2

La probabilité d'atteindre un sous-ensemble du bord à partir d'un état donné est égale à la somme des probabilités de tous les parcours allant de cet élément aux éléments du sous-ensemble ;

3

la durée moyenne des parcours allant d'un état au bord (le temps

moyen d'absorption) est la moyenne des longueurs des parcours de ce

sommet au bord pondérée par les probabilités de chaque transition. Si

on introduit une variable aléatoire égale au temps de parcours, il s'agit

donc de l'espérance de cette v.a.r.

(20)

Les règles

1

la probabilité de réaliser un parcours donné à partir d'un point donné est égale au produit de toutes les probabilités de transition le long de ce parcours ;

2

La probabilité d'atteindre un sous-ensemble du bord à partir d'un état donné est égale à la somme des probabilités de tous les parcours allant de cet élément aux éléments du sous-ensemble ;

3

la durée moyenne des parcours allant d'un état au bord (le temps

moyen d'absorption) est la moyenne des longueurs des parcours de ce

sommet au bord pondérée par les probabilités de chaque transition. Si

on introduit une variable aléatoire égale au temps de parcours, il s'agit

donc de l'espérance de cette v.a.r.

(21)

Les règles

1

la probabilité de réaliser un parcours donné à partir d'un point donné est égale au produit de toutes les probabilités de transition le long de ce parcours ;

2

La probabilité d'atteindre un sous-ensemble du bord à partir d'un état donné est égale à la somme des probabilités de tous les parcours allant de cet élément aux éléments du sous-ensemble ;

3

la durée moyenne des parcours allant d'un état au bord (le temps

moyen d'absorption) est la moyenne des longueurs des parcours de ce

sommet au bord pondérée par les probabilités de chaque transition. Si

on introduit une variable aléatoire égale au temps de parcours, il s'agit

donc de l'espérance de cette v.a.r.

(22)

1 0

2

3 4

1/2 5 1/2

1/2

1/2

1/2 1/2

1/2

1/2

p 1 = µ 1

2 3 + 1 2 4

¶ +

µ 1 2 3+4 +

1 2 4+4

¶ +

µ 1 2 3+2×4 +

1 2 4+2×4

¶ +

µ 1 2 3+3×4 +

1 2 4+3×4

+ · · ·

(23)

1 0

2

3 4

1/2 5 1/2

1/2

1/2

1/2 1/2

1/2

1/2

p 1 = µ 1

2 3 + 1 2 4

¶ +

µ 1 2 3+4 +

1 2 4+4

¶ +

µ 1 2 3+2×4 +

1 2 4+2×4

¶ +

µ 1 2 3+3×4 +

1 2 4+3×4

+ · · ·

(24)

1 0

2

3 4

1/2 5 1/2

1/2

1/2

1/2 1/2

1/2

1/2

Faites un calcul similaire pour déterminer la probabilité de perdre : vous

connaissez déjà le résultat donc vous pourrez contrôler vos calculs...

(25)

Temps de parcours

1

1 → 0 précédé de k cycles : X = 4k + 1, P ([X = 4k + 1]) = ³

2 1

4

´ k

× 1 2 = 2

4k+1

1 ;

2

1 → 2 → 0 précédé de k cycles : X = 4k + 2, P ([X = 4k + 2]) = ³ 1

2

4

´ k

× ¡ 1

2

¢ 2

= 2

4k+2

1 ;

3

1 → 2 → 4 → 5 précédé de k cycles : X = 4k + 3, P ([X = 4k + 3]) = ³

2 1

4

´ k

× ¡ 1

2

¢ 3

= 2

4k+3

1 ;

4

1 → 2 → 4 → 3 → 5 précédé de k cycles : X = 4k + 4, P ([X = 4k + 4]) =

³ 1 2

4

´ k

× ¡ 1

2

¢ 4

= 2

4k+4

1 .

(26)

Temps de parcours

1

1 → 0 précédé de k cycles : X = 4k + 1, P ([X = 4k + 1]) = ³

2 1

4

´ k

× 1 2 = 2

4k+1

1 ;

2

1 → 2 → 0 précédé de k cycles : X = 4k + 2, P ([X = 4k + 2]) = ³ 1

2

4

´ k

× ¡ 1

2

¢ 2

= 2

4k+2

1 ;

3

1 → 2 → 4 → 5 précédé de k cycles : X = 4k + 3, P ([X = 4k + 3]) = ³

2 1

4

´ k

× ¡ 1

2

¢ 3

= 2

4k+3

1 ;

4

1 → 2 → 4 → 3 → 5 précédé de k cycles : X = 4k + 4, P ([X = 4k + 4]) =

³ 1 2

4

´ k

× ¡ 1

2

¢ 4

= 2

4k+4

1 .

(27)

Temps de parcours

1

1 → 0 précédé de k cycles : X = 4k + 1, P ([X = 4k + 1]) = ³

2 1

4

´ k

× 1 2 = 2

4k+1

1 ;

2

1 → 2 → 0 précédé de k cycles : X = 4k + 2, P ([X = 4k + 2]) = ³ 1

2

4

´ k

× ¡ 1

2

¢ 2

= 2

4k+2

1 ;

3

1 → 2 → 4 → 5 précédé de k cycles : X = 4k + 3, P ([X = 4k + 3]) = ³

2 1

4

´ k

× ¡ 1

2

¢ 3

= 2

4k+3

1 ;

4

1 → 2 → 4 → 3 → 5 précédé de k cycles : X = 4k + 4, P ([X = 4k + 4]) =

³ 1 2

4

´ k

× ¡ 1

2

¢ 4

= 2

4k+4

1 .

(28)

Temps de parcours

1

1 → 0 précédé de k cycles : X = 4k + 1, P ([X = 4k + 1]) = ³

2 1

4

´ k

× 1 2 = 2

4k+1

1 ;

2

1 → 2 → 0 précédé de k cycles : X = 4k + 2, P ([X = 4k + 2]) = ³ 1

2

4

´ k

× ¡ 1

2

¢ 2

= 2

4k+2

1 ;

3

1 → 2 → 4 → 5 précédé de k cycles : X = 4k + 3, P ([X = 4k + 3]) = ³

2 1

4

´ k

× ¡ 1

2

¢ 3

= 2

4k+3

1 ;

4

1 → 2 → 4 → 3 → 5 précédé de k cycles : X = 4k + 4, P ([X = 4k + 4]) =

³ 1 2

4

´ k

× ¡ 1

2

¢ 4

= 2

4k+4

1 .

(29)

Rappel

Nous avons prouvé au module précédent que :

∀ q ∈ R, | q | < 1 =⇒ S = X

nÊ0 q n = 1 1 − q Pour | q | < 1, notons T = X

nÊ1 nq n−1 en supposant que cette écriture a un sens.

Calculer (1 − q)T en fonction de S

(30)

Rappel

Nous avons prouvé au module précédent que :

∀ q ∈ R, | q | < 1 =⇒ S = X

nÊ0 q n = 1 1 − q Pour | q | < 1, notons T = X

nÊ1 nq n−1 en supposant que cette écriture a un sens.

Calculer (1 − q)T en fonction de S

(31)

Rappel

Nous avons prouvé au module précédent que :

∀ q ∈ R, | q | < 1 =⇒ S = X

nÊ0 q n = 1 1 − q Pour | q | < 1, notons T = X

nÊ1 nq n−1 en supposant que cette écriture a un sens.

Calculer (1 − q)T en fonction de S

(32)

Sommaire

1 Vision dynamique des probabilités - Automates

Découverte

Premier exemple - Règles de parcours Deuxième exemple - Valeur moyenne 2 Comportement asymptotique des chaînes de

Markov

(33)
(34)

Départ

P PP PPP PPPP

F FF FFP FFPP

(35)

probabilité p i pour un état i d'être absorbé dans un sous-ensemble SB du bord ;

p i = 1 ; p i = 0 p i = X

k ∈S p ik p k p i = X

k ∈E

i

p ik p k

(36)

probabilité p i pour un état i d'être absorbé dans un sous-ensemble SB du bord ;

p i = 1 ; p i = 0 p i = X

k ∈S p ik p k p i = X

k ∈E

i

p ik p k

(37)

probabilité p i pour un état i d'être absorbé dans un sous-ensemble SB du bord ;

p i = 1 ; p i = 0 p i = X

k ∈S p ik p k p i = X

k ∈E

i

p ik p k

(38)

probabilité p i pour un état i d'être absorbé dans un sous-ensemble SB du bord ;

p i = 1 ; p i = 0 p i = X

k ∈S p ik p k p i = X

k ∈E

i

p ik p k

(39)

probabilité p i pour un état i d'être absorbé dans un sous-ensemble SB du bord ;

p i = 1 ; p i = 0 p i = X

k ∈S p ik p k p i = X

k ∈E

i

p ik p k

(40)

x

0

y 1

(41)

x

y 2 0

y 1+y 2 1

(42)

x

3y 4 y

2 0

y 1+y 2 1+y 2 1

(43)

x

7y 8 3y

4 y

2 0

y 1+y 2 1+y 2 1

(44)

3 4

10 7 3

5 2

5 0

4 5 9

10 9

10 1

(45)

Durée moyenne

La valeur du délai d'absorption est égal à 1 augmenté de la moyenne pondérée des délais d'absorption en les états voisins.

m i = 1 + X

kÊ1 p ik m k

(46)

Durée moyenne

La valeur du délai d'absorption est égal à 1 augmenté de la moyenne pondérée des délais d'absorption en les états voisins.

m i = 1 + X

kÊ1 p ik m k

(47)

X i = X

kÊ1 1 ik (1 + Y k )

(48)

Départ

P PP PPP PPPP

F FF FFP FFPP

(49)

Sommaire

1 Vision dynamique des probabilités - Automates

Découverte

Premier exemple - Règles de parcours Deuxième exemple - Valeur moyenne 2 Comportement asymptotique des chaînes de

Markov

(50)
(51)
(52)

V 1

V 3

V 2

0,2 0,1 0,8

0,3 0,1

0,2

0,6 0,5

0,2

(53)

matrice de transition

(54)

On notera x i (k) la proportion de traquants qui se trouvent au matin du jour k dans la ville V i .

Dénition 1 (Vecteur d'état)

On appelle vecteur d'état tout élément (x 1 , ..., x n ) de R n tel que x 1 + · · · + x n = 1.

Ainsi, x (k) =

³ x 1 (k) , x 2 (k) , x 3 (k) ´ est un vecteur d'état (pourquoi ?).

Démontrez que :

∀ k ∈ ‚ 1 , n ƒ, x (k) = x (k−1) · P puis que :

∀ k ∈ ‚ 1 , n ƒ , x (k) = x (0) · P k

(55)

On notera x i (k) la proportion de traquants qui se trouvent au matin du jour k dans la ville V i .

Dénition 1 (Vecteur d'état)

On appelle vecteur d'état tout élément (x 1 , ..., x n ) de R n tel que x 1 + · · · + x n = 1.

Ainsi, x (k) =

³ x 1 (k) , x 2 (k) , x 3 (k) ´ est un vecteur d'état (pourquoi ?).

Démontrez que :

∀ k ∈ ‚ 1 , n ƒ, x (k) = x (k−1) · P puis que :

∀ k ∈ ‚ 1 , n ƒ , x (k) = x (0) · P k

(56)

On notera x i (k) la proportion de traquants qui se trouvent au matin du jour k dans la ville V i .

Dénition 1 (Vecteur d'état)

On appelle vecteur d'état tout élément (x 1 , ..., x n ) de R n tel que x 1 + · · · + x n = 1.

Ainsi, x (k) =

³ x 1 (k) , x 2 (k) , x 3 (k) ´ est un vecteur d'état (pourquoi ?).

Démontrez que :

∀ k ∈ ‚ 1 , n ƒ, x (k) = x (k−1) · P puis que :

∀ k ∈ ‚ 1 , n ƒ , x (k) = x (0) · P k

(57)

Supposons que le chef de la maa locale dispose de 1000 traquants qui partent tous le matin du jour 0 de la ville de Zlot. Quelle sera la proportion de traquants dans chacune des villes au bout d'une semaine ? d'un an ? Il s'agit donc de calculer des puissances successives de P.

On obtient les proportions au bout d'une semaine en calculant x (0) · p 7 avec x (0) = (1000 , 0 , 0).

Nous allons utiliser SCILAB pour les longs calculs.

(58)

Supposons que le chef de la maa locale dispose de 1000 traquants qui partent tous le matin du jour 0 de la ville de Zlot. Quelle sera la proportion de traquants dans chacune des villes au bout d'une semaine ? d'un an ? Il s'agit donc de calculer des puissances successives de P.

On obtient les proportions au bout d'une semaine en calculant x (0) · p 7 avec x (0) = (1000 , 0 , 0).

Nous allons utiliser SCILAB pour les longs calculs.

(59)

Dénition 2 (Matrice de transition régulière)

Une matrice de transition A est dite régulière si, et seulement si, il existe un

entier naturel r tel que A r a ses coecients tous strictement positifs.

(60)

Théorème 3 (Théorème des chaînes de Markov régulières) Soit A une matrice régulière. Il existe une matrice stochastique :

A ∞ =

a 1 a 2 · · · a n

a 1 a 2 · · · a n ... ... ... ...

a 1 a 2 · · · a n

 telles que lim n→+∞ A n = A ∞ .

De plus, v = (a 1 , a 2 , · · · , a n ) est l'unique vecteur d'état stationnaire (tel que

v · A = v).

Références

Documents relatifs

Josette reçoit donc la boîte fermée : elle utilise sa clé, qu’elle seule possède, pour ouvrir la boîte et se pâmer devant vos élans épistolaires.. (IUT de Nantes -

This treatment of nan ensures that compare defines a total ordering relation. (IUT de Nantes - Dpt d’informatique ) 11

induction mathématique (raisonnement par récurrence) fonction récursive, type récursif. (IUT de Nantes - Dpt d'informatique ) 20

Ce qui va nous intéresser informatiquement, c'est une fonction qui crée une partition d'un ensemble selon une propriété, par exemple pour regrouper les entiers pairs parmi les

Vous disposez de deux interrupteurs commandant une même ampoule : comment modéliser le système de va-et-vient. (IUT de Nantes - Dpt d'informatique ) 33

5 Quelques lois discrètes classiques Loi uniforme (discrète) Loi de Bernoulli Loi binomiale Loi de Pascal Loi de Poisson.. (IUT de Nantes - Dpt d’informatique ) 2

Formez les couples (x , y) tels que x soit le grand-père de y. Formez les couples (x , y) tels que x soit le frère

La moyenne est très supérieure à la médiane, car la plupart des communes sont faiblement peuplées, mais les villes comme Strasbourg, Mulhouse, Colmar et Haguenau contiennent près de