• Aucun résultat trouvé

ici un corrigé personnel

N/A
N/A
Protected

Academic year: 2022

Partager "ici un corrigé personnel"

Copied!
9
0
0

Texte intégral

(1)

CAPES Maths 2017, épreuve 2, problème 2 : Marches aléatoires

Le problème 2 de cette épreuve propose une application des graphes probabilistes et des matrices stochastiques à des méthodes de classement des pages web. Cette application est intéressante, on prend un réel plaisir à la découvrir. Coup de chapeau à l’auteur du sujet.

Reste à savoir si un tel problème est adapté pour sélectionner des futurs professeurs de Mathématiques, mais ça c’est une autre question. On verrait davantage ce problème dans une Prépa écoles de commerce.

Partie A : Marche aléatoire sur un graphe

I. 1. Les évènements Ei( )k =« Le point est sur le sommet i à l’étape k » pour i=1, 2,...,n forment un système complet d’évènements. La somme de leurs probabilités est donc égale à 1.

I. 2. Si on considère la transition de l’étape k à l’étape suivante :

Pour chaque j

{

1,2,..., n

}

et d’après la formule des probabilités totales :

= ( )

= + =i n ×

i

k i j i k

j a p

p

1 , )

1

( . Ce qui

représente le produit LICO des termes du vecteur ligne P( )k par ceux de la colonne numéro j de la matrice A.

Globalement : P( )k+1 =P( )k A

I. 3. P( )k =P( )0 Ak

I. 4. D’après l’invariance de la limite d’une suite par translation d’indice : P( ) P( )k P

k k

k = =

+∞

+ +∞

lim

lim 1 .

Compte tenu que pour tout entier k : P( )k+1 =P( )k ×A , par passage à la limite :

( )

(

P( ) A

)

P

P k

k k

k = ×

= +∞

+ +∞

lim

lim 1

D’après les règles de calcul sur les limites :

(

P( ) A

) (

k P( )k

)

A

k

ia k

gilbertjul × = ×

+∞

+∞

lim

2017 lim .

Ce qui donne : P=P×A

(2)

II. Marche aléatoire sur un tétraèdre 1 et 2. Calcul de U et de 2 U . 3

On remarque en particulier la très utile relation : U

I U2 =3 + 2

D’autre part, sachant que A U 3

=1 , 2 2 9 1U A =

et 3 3

27 1 U

A = .

On remarque en particulier la relation : A

I U I U

A 3

2 3 1 9 2 3 1 9

1 2

2 = = + = +

I. 3 à 7. L’existence de termes αk ;βk est attestée ci-dessus aux rangs 0, 1, 2 et 3 avec : 6

; 3

; 0

;

1 1 2 3

0 = α = α = α =

α ainsi que β0 =0; β1 =1; β2 =2;β3=7.

Supposons que cette existence soit établie à un rang k (k≥0), c'est-à-dire qu’il existe deux réels αk, βk tels que : Ukk IkU. Alors au rang suivant k+1 :

(

I U

)

U

(

I U

)

I

( )

U

U U U

Uk+1 = × k = × αkkkk 3 +2 =3βk + αk +2βk . L’existence est établie aussi au rang suivant k+1 avec :



+

=

=

+ +

k k k

k k

β α β

β α

2 3

1

1 . Elle l’est donc à tous les rangs.

Ce qui construit par récurrence deux suites permettant l’expression de Uk en fonction de I et de U pour tout entier naturel k.

Des relations de récurrence :



+

=

=

+ +

+ +

1 1

2 1

2 3

k k

k

k k

β α

β

β

α on déduit la relation de récurrence double ne portant que

sur les termes de la suite

( )

βk : kN:βk+22βk+13βk =0.

La suite

( )

βk est un élément de l’espace vectoriel de dimension 2 des suites réelles dont les termes satisfont la relation de récurrence (R) : kNk+2 −2βk+1−3βk =0

L’équation caractéristique associée à (R) étant l’équation r2 −2r−3=0 qui a deux solutions distinctes 3

;

1 2

1 =− r =

r , la suite

( )

βk est combinaison linéaire des suites géométriques

( ) ( )

1k et

( )

3k . Il existe deuxgjréels x et y tels que : kN: βk =x.

( )

−1k + y.3k

L’étude des rangs zéro et 1 indique que :



+

=

= +

=

=

y x

y x

gjulia 1 3

0

1 0

2017 β

β . Ainsi :

4

; 1 4

1 =

= y

x

On obtient :

( )

4 1 : 3

k k

kk = − −

N β et de là :

( )

4 1 3 2 3

: 1

k k

k k

kk = − = + −

N α β + β

(3)

De Ukk IkU , on déduit : A

(

I U

)

I U

k k

k k k

k

ia

gilbertjul 4

3 1 1 4

3 3 1 1 3

1

2017



 

−

− +



 

− +

= +

= α β puis

( ) ( )

 

=

= k kk kk kk kk

k P A

P 3 3 3 3

0 α β β β

et enfin ( ) ( )

 

=

+∞ =

4

1 4 1 4 1 4

lim k 0 k 1

k P P A

À la longue, les probabilités de présence du point aux différents sommets tendent à s’équilibrer.

III. Marche sur une « pyramide tronquée » 1. La matrice de transition est celle dont le coefficient de la ligne i et de la colonne j est égal à la probabilité que le point arrive en j venant de i.

La matrice de transition de ce graphe est de ce fait la matrice ci-contre.

La somme des termes de chaque colonne étant égale à 1 (une telle matrice est dite

« bistochastique » ; non seulement la somme des termes de chaque ligne est égale à 1, mais c’est également le cas de la somme des termes de chaque colonne), le produit LICO des termes de

[

1 1 1 1 1 1 1 1

]

=

V par une colonne

quelconque de A est égal à 1. Le vecteur V est un vecteur invariant par l’action de A à droite :

A V V =





















=

0 1 0 1 1 0 0 0

1 0 1 0 0 1 0 0

0 1 0 1 0 0 1 0

1 0 1 0 0 0 0 1

1 0 0 0 0 1 0 1

0 1 0 0 1 0 1 0

0 0 1 0 0 1 0 1

0 0 0 1 1 0 1 0

3 1

2017 gjulia

A

III. 2. Aussi bien, la « pyramide tronquée » pourrait être un cube. Une partition de l’ensemble des huit sommets apparaît plus facilement : deux sommets sont dans le même sous-ensemble si et seulement si ils sont non voisins mais ont au moins un voisin commun (i.e. ils sont diagonalement opposés) ce qui induit une partition en exactement deux sous-ensembles :

X est l’ensemble des sommets qui sont non voisins mais qui ont un voisingjcommun avec le sommet 1.

Y est l’ensemble des sommets qui sont non voisins mais qui ont un voisin commun avec le sommet 2.

Le seul fait d’avoir obtenu une partition de l’ensemble des huit sommets en deux sous ensembles exactement assure que si le point est sur un sommet de X, alors à l’étape suivante il passe sur un sommet voisin donc un

(4)

III.3. La matrice A estconstituée de telle sorte que :

(

iX

)

:jY,ai,j =0 et

(

iY

)

:jX, ai,j =0 (puisque deux sommets du même sous-ensemble sont non voisins).

On en déduit que, si j appartient à X :

( )

+ = ×

Y i

k i j i k

j a p

p ( 1) , et, si j appartient à Y,

( )

+ = ×

X i

k i j i k

j a p

p ( 1) , .

Le calcul des vecteurs P( )k pour k=1, 2,3 fait apparaître que ∀iX, pi( )1 = pi( )3 =0 et que ∀iY, pi( )0 = pi( )2 =0. gjulia2017

Supposons que au rang 2k : iY, pi( )2k =0, propriété qui est initialisée par les vérifications ci-dessus.

On va montrer que cette hypothèse entraîne d’abord que ∀iX, pi(2k+1) =0 et ensuite que ∀iY, pi(2k+2)=0 , c'est-à-dire que la propriété « ∀iY, pi( )2k =0 » est héréditaire et qu’elle entraîne une nullité analogue pour le rang impair suivant.

D’abord quel que soit j appartenant à X : (2 1) =

, × ( )2 =0

+

Y i

k i j i k

j a p

p puisque d’après l’hypothèse de

récurrence ∀iY : pi(2k) =0. C’est la « nullité analogue au rang impair suivant ».

Ensuite quel que soit j appartenant à Y : (2 2) =

, × (2 1)=0

+ +

X i

k i j i k

j a p

gjulia p puisque d’après ce qu’on vient

d’établir,∀iX, pi(2k+1) =0. C’est la preuve de l’hérédité de la propriété « ∀iY, pi( )2k =0 ».

Ainsi, quel que soit l’entier naturel k : iY, pi( )2k =0 et ∀iX, pi(2k+1) =0.

Dès lors, la suite

( )

P( )k ne peut pas être convergente. En effet, si c’était le cas, pour chaque indice i la suite

( )

pi( )k ne pourrait converger que vers zéro, puisqu’un terme sur deux de cette suite est nul. La convergence de

( )

P( )k ne pourrait se faire que vers le

gjvecteur nul, ce qui est impossible puisque ( ) 1

8

1

=

= i

k

pi et qu’il faudrait que

( )

P( )k converge vers un vecteur ligne de somme égale à 1.

(5)

IV. Le I. 4 nous a montré que, si la suite

( )

P( )k est convergente, alors il existe un vecteur P tel que P=PA, c’est l’implication directe.

Le III nous montre un contre exemple : Il existe une marche aléatoire dont la matrice de transition accepte un vecteur non nul invariant mais dont la suite

( )

P( )k ne converge pas. L’implication réciproque est fausse.

Seule, une implication directe est licite :

(

P, klim+∞P( )k =P

)

P=PA

Partie B : Matrices stochastiques.

I. Dire qu’une matrice A=

( )

ai, j est stochastique revient à dire que :

{

1,2,...,

}

: 1

1

, =

=

= n j

j j

ai

n

i .

Or,

=

= n j

j j

ai 1

, est le produit LICO de la i-ème ligne de la matrice A et du vecteur colonne





= 1 ...

1

gjulia

C .

Ainsi, A est stochastique si et seulement si C est invariant par l’action de A à gauche (i.e. AC = C).

On note au passage que 1 est une valeur propre de A et





= 1 ...

1

C en est un vecteur propre.

II. Soit A la matrice de transition d’un graphe. Soit un indice i fixé de

{

1, 2,...,n

}

. Pour tout indice j de

{

1,2,..., n

}

, le nombre positif ai,j est la probabilité conditionnelle, sachant que le point se trouve sur le sommet i , qu’il passe au sommet j lors de l’étape suivante. La matrice A est à termes positifs et pour chaque indice i la somme des termes de sa ligne d’indice i,

=

= n j

j j

ai 1

, , est la somme des probabilités de toutes les arêtes du graphe issues du sommet i, cette somme est égale à 11. Il s’agit d’une matrice stochastique.

III. X A=

[

y1 y2 ... yn

]

est un vecteur ligne dont tous les termes sont positifs car sommes de produits de réels positifs. Pour chaque indice j :

=

=

=i n

i

j i i

j x a

y

1

, , produit LICO de X par la colonne numéro j de A.

∑ ∑

=

=

=

=

=

= 



= j n

j n i

i

j i i n

j

j

j x a

y

1 1

, 1

. En inversant l’ordre de sommation :

∑ ∑

=

=

=

=

=

= 



= i n

i

n j

j j i i n

j

j

j x a

y gj

1 1

, 1

.

Or : 1

1

, =

=

= n j

j j

ai pour tout indice i en tant que somme des termes d’une ligne de A.

1 L’évènement « Le point est en i à l’étape k » est la réunion disjointe des n évènements pour j = 1, 2, …,n : « Le point

(6)

On obtient :

∑ ∑

=

=

=

=

=

=i n

i i n

j

j

j x

y

1 1

1 . La somme des termes de X A=

[

y1 y2 ... yn

]

est égale à 1.

Si X est une densité de probabilité, alorsX A est aussi une densité de probabilité.

Revenons maintenant à la question II. Du fait de la relation de récurrence P( )k+1 =P( )k A, « P( )0 densité de probabilité » implique par récurrence évidente que, pour tout entier naturel k, =P( )k est aussi une densité de probabilité.

IV. 1. Si A et B sont stochastiques, elles sont à termes positifs. Leur produit ABest aussi une matrice à termes positifs, chaque terme de ce produit étant somme de produits de réels positifs.

Par ailleurs, en vertu de B. 1 et de l’équivalence qui y a été démontrée : Si A et B sont deux matrices stochastiques, alors le vecteur





= 1 ...

1

gjulia

C est laissé invariant par l’action de B à gauche puis par l’action de

A, donc par l’action à gauche du produit AB. C étant invariant par l’action à gauche deAB, matrice à termes positifs, AB est une matrice stochastique.

IV. 2. Soient A=

( )

ai,j et B=

( )

bi,j deux matrices stochastiques. Soit aussi α un réel appartenant à

[ ]

0,1.

Pour chaque couple d’indices

( )

i, j , αai,j +

(

1−α

)

bi,j est un réel positif (barycentre appartenant au segment

[

ai,j ;bi,j

]

). La matrice α A+

(

1−α

)

B est

gjune matrice à termes positifs.

De plus par linéarité :

(

α A+

(

1α

)

B

)

×C=α A×C+

(

1α

)

B×C

A et B étant stochastiques, A×C=B×C=C.

On obtient

(

α A+

(

1α

)

B

)

×C=C. En vertu de B. 1 la matrice α A+

(

1α

)

B est stochastique.

V et VI. Pour chaque entier k, X( )k =

[

x1( )k x2( )k ... xn( )k

]

est un vecteur à termes positifs et de somme 1.

Si la suite

( )

X( )k converge vers un vecteur X =

[

x1 x2 ... xn

]

:

Pour chaque indice i , xi est limite d’une suite de termes positifs, donc est positif et de plus :

(

lim ( )

)

lim

( )

( ) 1

1 1

=



= 

=

=

=

=

n i

i k k i

n i

i

k

k xi x , le vecteur limite X est une densité de probabilité.

Les lignes d’une matrice stochastique étant des densités de probabilité, celles de son éventuelle matrice limite sont des densités de probabilité. Cette éventuelle matrice limite est stochastique.

(7)

Partie C : Pages rank. Un premier modèle

II. 1. Par construction, A est une matrice à termes positifs. De plus, pour chaque indice i de

{

1, 2,...,n

}

:

1 1 1 1

1

1

, = =



= 

=

∑ ∑

=

= i

j i i i j

i i

n j

j j

i gilbertjulia

a λ

λ λ

λ . Chaque ligne de la matrice A est une densité de probabilité, A est stochastique.

III. Pour chaque indice j de

{

1,2,...,n

}

:

∑ ∑

=

=

=i n

i

i j i i

j

i i

a

1 ,

1µ µ

λ et représente le produit LICO du vecteur ligne M =

[

µ1 ... µn

]

avec la colonne d’indice j de la matrice A. C’est le terme d’indice j du vecteur ligne

A

M . Ainsi i

j

i i

j µ

µ

λ

= 1

pour tout j de

{

1,2,...,n

}

si et seulement si M = M A

IV. Encore faudrait-il définir ce qu’on entend par densité de probabilité initiale. On fait l’hypothèse que le surfeur part de la page requête, et donc que P( )0 vaut 1 pour l’indice de cette page, et 0 pour toutes les autres. Cette hypothèse étant faite, 1 et 2 ne sont que des reformulations de ce qui a été déjà traité.

Partie D : Pages rank. Un second modèle

I. Les matrices A et J n

1 étant toutes deux stochastiques, en vertu de B. IV. 2, la matrice

( )

J

A n1

1 α

α + −

est stochastique pour tout réel α∈

] [

0,1 .

II. Par hypothèse, pour tout indice j de

{

1, 2,...,n

}

:

∑ ∑ ∑

=

=

=

=

+ −

=



 

 + −

= i n

i i j

i i

i i

n i

i

j i

j v

n v v

a n

gjulia v

1 1

,

1 1

2017

α λ

α α

• Le nombre

=

=

i n

i

vi

n 1

1 α

est une constante et

j

i i

vi

λ est fonction linéaire des pertinences des pages qui pointent vers la page j. La pertinence vj est donc fonction affine des pages qui pointent vers la page j.

La contribution de la page i à la pertinence de la page j est fonction inverse (donc décroissante) du nombre de liens issus de cette page.

III. J est une matrice formée exclusivement de 1, et la somme des termes du vecteur ligne Q est égale à 1. Il en résulte que QJ=L puisque pour chaque indice j, la coordonnée d’indice j de QJ est :

=

= n i

i

qi 1

.

IV. La cordonnée d’indice i du vecteur colonne UA se calcule par la formule :

= n

j j

ai 1

, .

A étant une matrice stochastique, toutes ses lignes sont des densités de probabilités. Quel que soit l’indice i

{ } ∑

n = =

(8)

V. Si λ est une valeur propre de A et Z en est un vecteur propre : AZ z

z Z

n

gjulia =





=

λ λ

λ ...

1

2017

Quel que soit l’indice i de

{

1, 2,...,n

}

, la coordonnée d’indice i du vecteur colonne AZ est :

=

=

=j n

j

j j i

i a z

z

1

λ , . Puisque les ai,j sont tous des réels positifs, l’inégalité triangulaire sur les

modules s’applique de la façon suivante : i

n i n

j j i n

j

j j i n

j

j j

i z a z a z

a = =

=

×



≤

∑ ∑

1

1 , 1

, 1

, max .

Or : 1

1

, =

= n

j j

ai , somme des termes d’une ligne de A. On obtient l’inégalité :

n i i n

j

j j i i

i z a z z

z = gjulia

=

1 1

, max

λ

λ

Cette inégalité étant vérifiée pour tout indice i, elle l’est aussi pour l’indice de la coordonnée de module

maximal : i

n i i n

i z z

1

1 max

λ max . Cette coordonnée de module maximal est non nulle puisque Z est un vecteur non nul, et son module est strictement positif. Nécessairement, λ ≤1.

En conclusion, toutes les valeurs propres de A ont un module 1

Soit γ un réel strictement compris entre 0 et 1. Supposons que In −γ A soit non inversible.

Alors ker

(

In −γ A

) { }

≠ 0n . Il existerait dans ce cas un vecteur non nul





= zn

z Z ...

1

tel que

( )





=

×

0 ...

0 Z A

In γ c'est-à-dire tel que : AZ Z γ

=1 . Le réel γ

1 est strictement supérieur à 1 et serait une

valeur propre de A, dont Z serait vecteur propre. Ce qui serait contradictoire avec le fait que les valeurs propres de A ont toutes un module inférieur ou égal à 1. Nécessairement, In −γ A est inversible.

C’est le cas en particulier de In

(

1−α

)

A pour tout réel α tel que 0<α <1 VI. Si = L×

(

I

(

1

)

A

)

1

H αn n α

alors :

( ( ) )

L

A n I

H× n − 1−α = α soit : L

( )

HA

H =αn + α 1

VII. Q( )0 =Q et ( )

( )

 

 − +

=

= J

A n Q

B Q

gj Q

α α

1 1

.

D’après les questions précédentes, si Q est une densité de probabilité et B une matrice stochastique, alors pour tout naturel k, Q( )k =QBkest aussi une densité de probabilité. Donc, pour tout entier naturel k :

(9)

( )J L

Q k = pour les mêmes raisons que celles évoquées pour QJ =L, la somme des termes du vecteur ligne

( )k

Q étant elle

gjaussi égale à 1.

On va pouvoir utiliser la relation Q( )k JL=0n,n pour n’importe quelle valeur de k quand l’occasion se présentera.

Ainsi, lorsque k =1 :

( )

( ) ( ) ( )( ) (

QJ L

) ( )(

Q H

)

A

A n H Q HA

n L n J

A Q

H Q

gjulia

=

− +

=



 

 + −



 

 − +

=

1 α α α 1 α 1 α α 1 α

1 .

Plus généralement, entre les rangs k et k +1 (k entier naturel) :

( ) ( ) ( )

( ) ( ) ( )

( )

(

Q( )J L

)

HA n A Q HA

n L n J

A Q

H B Q H

Q k k k = − k − + k

 

 + −



 

 − +

=

=

+1 − 1 α α α 1 α 1 α α

On obtient la relation de récurrence : Q( )k+1 H =

(

1α

) (

Q( )k H

)

A

Dès lors, par une récurrence facile : pour tout entier k, Q( )k H =

(

1α

) (

k QH

)

Ak.

VIII à XI. Les matrices Ak étant stochastiques, leurs coefficients sont positifs et les sommes des coefficients de chaque ligne sont égales à 1. Les coefficients de Ak sont nécessairement tous compris entre 0 et 1, et ceux de

(

QH

)

Ak sont tous compris, indépendamment de k, entre min

(

QH

)

et max

(

QH

)

, les coefficients minimal et maximal de QH.

Les coefficients de Q( )kH sont bornés par les deux suites

(

1α

)

kmin

(

QH

)

et

(

1α

)

kmax

(

QH

)

,

toutes deux sont des suites convergentes vers zéro.

On en déduit :klim+∞

(

Q( )k H

)

=0 puis klim+∞

( )

Q( )k =H

L’avantage est que l’on obtient une suite de densités de probabilité qui est toujours convergente, ce qui n’était pas le cas avec la méthode précédente.

La suite

( )

Q( )k convergeant vers H, Q( )k permet d’approcher H pour k « assez grand ». Je ne vois pas d’autre « justification mathématique » que cette convergence. Encore faudrait-il préciser ce que l’on entend par « k assez

gjgrand » ( ?).

Il semble qu’on peut agir sur la vitesse de convergence en choisissant convenablement le facteur d’amortissement α (plus ce coefficient est voisin de 1, plus la suite

(

1α

)

k converge rapidement vers zéro).

Mais je n’ai aucune idée de ce que ça peut donner pour des matrices de taille gigantesque (je ne sais pas dans quelle mesure l’écart de chaque terme avec celui correspondant la matrice limite a un impact global pour de telles matrices …).

Références

Documents relatifs

En rajoutant une arête entre les sommets de degré impair A et D, on obtient un nouveau graphe dont tous les sommets sont de degré pair : le nouveau graphe admet un cycle

• une m´ethode ajouter() dont le seul param`etre est l’entier dont une oc- currence est ` a ajouter au multi-ensemble (si celui-ci n’est pas plein), qui renvoie true si on a pu

Ces enfants sont pris en charge par des figures de soins professionnelles (éducateurs). L’objectif du présent mémoire de maîtrise est de mieux comprendre l’expérience

D'après le théorème : si deux triangles ont un angle égal compris entre deux côtés égaux deux à deux, alors ces deux triangles sont isométriques.. Donc les triangles ABC

[r]

[r]

On conclut que les points A', Ge , I sont alignés si et seulement si le triangle ABC est isocèle en A ou rectangle

On considère trois triangles isocèles de même base BC et de sommets A₁,A₂ et A₃ situés du même côté par rapport