Modèle dynamique inconnu et structure connue

1.4 Méthodes de prédiction

1.4.4 Modèle dynamique inconnu et structure connue

Abordons maintenant le scénario où le réseau et des séries temporelles de l’activité sont ob- servés, mais le mécanisme dynamique est inconnu. Ce serait le cas si nous avions à analyser une série temporelle des populations d’un écosystème familier, c.-à-d. où le réseau trophique est connu, mais qu’on ne peut directement associer un modèle de populations réaliste. Nous nous retrouvons donc dans une situation difficile où nous cherchons à documenter la résilience dynamique du réseau sans aucun repère sur les bifurcations possibles de la dynamique sous- jacente. Une option est de choisir un modèle dynamique et d’en inférer les paramètres qui expliquent le mieux la série temporelle observée. Une fois l’inférence faite, on pourra se référer aux techniques présentées à la section Modèle dynamique et structure connus (Sec.1.4.1). Le problème discuté se formalise comme suit. La matrice d’adjacence W de la structure est parfaitement connue. Une série temporelle unidimensionnelle pour chaque noeud, regroupée sous une matrice X ∈ RN ×T _{où T est le nombre d’observations, est également connue. On} suppose que le paradigme des réseaux complexes dynamiques s’applique et que la structure a un effet quelconque sur la dynamique,

X =_{M(W , θ, X}0), (1.89)

où θ est un ensemble de paramètres cachés, X0 ∈ RN ×τ et M(·) est un mécanisme dynamique. On note ici que X0 n’est pas forcément un vecteur et qu’il peut être de longueur τ. Il désigne le plus petit ensemble de conditions initiales requises pour déterminer l’évolution de la dynamique. Par exemple, on aura τ = 1 pour une dynamique markovienne. En posant une forme à M(·), il sera possible d’inférer les paramètres θ afin d’utiliser M(W , θ, X0)pour décrire la résilience dynamique. Le travail se résume alors à une tâche d’inférence dont on présente les méthodes de résolution.

MCMC

Pour tout problème d’inférence, la première question est : est-ce que la vraisemblance du modèle est connue ? Si la réponse est non, alors le problème se complexifie. Par contre, si la réponse est oui, on emploie une méthode Monte-Carlo par chaîne de Markov (MCMC) pour échantillonner l’espace des paramètres et en faire l’inférence dont on fait la description ici. On suppose une distribution de vraisemblance P (X|θ, W ) inscrivant la probabilité que X a été généré sachant le mécanisme dynamique M(·) et ses paramètres W , θ.

Pour simplifier la notation, on ne notera plus W dans les distributions statistiques puisqu’il s’y retrouve partout, e.g., P (X|θ, W ) = P (X|θ). On peut maintenant écrire l’équation de Bayes,

P (θ|X) = P (X|θ)P (θ)

P (X) , (1.90)

où P (θ) est la probabilité a priori sur les paramètres et P (X) est l’évidence de la série temporelle. On estime les paramètres réels θ∗ _{soit en maximisant la probabilité a posteriori}

θMAX=argmax_θP (θ_|X) (1.91)

ou bien par l’espérance de la distribution a posteriori, ˆ

θMMSE= Z

θP (θ|X)dθ = E[θ|X]. (1.92)

Il est d’ailleurs aisé de montrer que cette forme minimise l’erreur quadratique moyenne10_(d’où

le titre estimateur MMSE - minimum mean-squared error), ˆ

θMMSE= min f ( ˆθ) = min Z

( ˆθ_{− θ)}2P (θ_|X)dθ. (1.93) Sans être une loi universelle, il est souvent suggéré de choisir l’estimateur ˆθMMSEsi le support le permet (si le support est discret, la marginale pourrait ne pas être une solution réaliste).

Approximate Bayesian Computation

Si la fonction de vraisemblance P (X|θ) est difficile à écrire ou à évaluer, alors on ne peut pas évaluer la formule de Bayes et les estimateurs ˆθMMSE _{et ˆ}_θMAX _{ne sont pas directement} mesurables. La méthode Approximate Bayesian Computation (ABC) contourne ce problème en travaillant avec des fonctions de coût prédéfinies.

On suppose un mécanisme X = M(W , θ, X0). On échantillonne un ensemble de paramètres θselon une distribution a priori P (θ). Pour chaque échantillon, on génère une série temporelle

0 20 40 60 80 Temps 0 10 20 Noeud Infecté Susceptible 0.05 0.10 0.15 0.20 Taux d'infection 0.05 0.10 0.15 0.20 0.25 0.30 Taux de rétablissement Estimé Réel (a) 0.05 0.10 0.15 0.20 Taux d'infection 0.10 0.15 0.20 0.25 0.30 Taux de rétablissement Estimé Réel (b) 0.09 0.10 0.11 0.12 Taux d'infection 0.17 0.18 0.19 0.20 0.21 0.22 Taux de rétablissement MMSE Réel (c)

Figure 1.9 – En haut, la série temporelle générée de la dynamique SIS avec un taux d’infection α = 0.1 et un taux de rétablissement β = 0.2 sur un réseau Erdős-Rényide N = 30 noeuds et M = 65 liens. En

(a-b), distribution a posteriori P (α, β_{|X) échantillonnée avec la méthode ABC. En (a), la fonction de}

coût est L(X0, X) =_|hX0_{i − hXi| alors qu’en (b), L(X}0, X) =_|hX0_{i − hXi| + |Var(X}0)_{− Var(X)|.}

En (c), distribution a posteriori estimée par MCMC simulated annealing.

X0 =_{M(W , θ, X}0)qu’on viendra comparer à la série temporelle originale selon une fonction de coût L(X0_{, X). On accepte θ si L est inférieure à un certain seuil . Si est suffisamment} petit, alors il est attendu que la distribution a posteriori est estimée par

P (θ_{|X) ∝ P [L(X}0_{|X) < ]P (θ).} (1.94) L’estimateur statistique est donné soit par la maximisation du postérieur soit par la marginale.

Exemple de la dynamique SIS

Pour la dynamique SIS, la vraisemblance est connue en fonction des deux paramètres : le taux de transmission α et de rétablissement β. En effet,

P (X_{|θ) =} T Y t=1 N Y i=1 P (xi(t)|X(t − 1)) (1.95) avec P (xi(t)|X(t−1)) = h (1− (1 − α)mi(t)₎₍₍₁_{− α)}mi(t)(1−xi(t))₎ i1−xi(t−1)h (1− β)xi(t)_β1−xi(t) ixi(t−1) (1.96)

où mi(t) =PNj=1wijxj(t)est le nombre de voisins infectés au temps t. Pour échantillonner la distribution a posteriori, on utilise une approche numérique du type Metropolis-Hasting avec Simulated Annealing. Le détail des méthodes est laissé en référence [162]. À la Fig. 1.9, la distribution a posteriori est présentée pour une série temporelle issue d’une dynamique SIS. Si l’on compare ce résultat aux figures 1.9(a-b) obtenues par la méthode ABC, il est évident que la méthode MCMC donne une distribution a posteriori plus uniforme.

Les méthodes ABC souffrent du problème que le choix de la fonction de coût est critique malgré que peu d’indices sont disponibles pour guider notre sélection. Par exemple, en Fig. 1.9(a), le choix est malheureux, car plusieurs couples de paramètres (α, β) satisfont parfaitement la fonction de coût. En effet, le nombre moyen d’individus infectés est gouverné par le ratio α/β. Par conséquent, tous les couples (α, β) tels que α/β = α∗_/β∗ _{seront généralement acceptés} par la méthode ABC. Dans l’exemple, l’espace échantillonné est borné par α < 0.3 et β < 0.3 et donc les marginales donnent de manière hasardeuse une bonne estimation des paramètres réels.

La méthode ABC et la formule de Bayes présupposent l’existence d’un mécanisme dynamique. Notre modélisation des séries temporelles est donc limitée par notre capacité à imaginer de nouvelles formes mathématiques pour ces mécanismes. Ainsi, l’expérience du modélisateur à poser un modèle approprié devient critique. Si le modèle est trop différent de la réalité, alors le pouvoir prédictif peut être quasi-nul. Rappelons-nous de l’exemple du virus Zika où un modèle classique SIS donnera un seuil de transmission qualitativement différent d’un modèle épidémiologique avec différents vecteurs de transmission [4].

Suite à ces commentaires, il semble se dégager un besoin évident d’un outil capable à la fois d’inférer un mécanisme effectif et ses paramètres via la structure du réseau et une observation de la dynamique. C’est possiblement ce que le paradigme de l’apprentissage automatique sur graphes est en mesure d’accomplir.

L’apprentissage sur graphes consiste à poser une forme mathématique hautement paramétrée qu’on optimise pour accomplir une tâche particulière [174]. Alors qu’il est commun de les voir résoudre des tâches de détection de communautés, recommandation de produits, classifica- tion, et de segmentation pour ne nommer que ceux-ci, ces machines proposent une solution intéressante au problème de modélisation dynamique [64,163, 165,179]. Au chapitre 4, nous emprunterons cet outil pour modéliser les séries temporelles structurées et en inférer les per- turbations structurelles.

Dans le document La résilience des réseaux complexes (Page 57-61)