• Aucun résultat trouvé

Figure 5.5 – Les cascades de 2015, bornées à un mois, sont divisées en groupes selon leur taille. Au sein d’un groupe, l’écart de taille entre la plus grande et la plus petite cascade est de 10 nœuds. Les ACSI sont comparées par groupe, pour ne retenir que celles d’ASCI maximales d’une part, et celles d’ASCI minimales d’autre part. La fraction moyenne de nœuds atteins en fonction du temps est calculée, pour les cascades obtenant les ASCI maximales puis pour celles obtenant les scores minimaux. L’intervalle de confiance est représenté à chaque instant de temps.

5.3 Modélisation de la dynamique de propagation

Modéliser la diffusion des maladies, et confronter les observations avec celles obtenues lors des simulations des chapitres précédents, permet de tester la validité de différentes hypothèses décrivant la dynamique de propagation.

5.3.1 Modèle à temps d’interactions aléatoires

Un modèle simple pour simuler la dynamique de propagation consiste à tirer aléatoire-ment des temps d’infection pour chacun des nœuds atteints. Compte-tenu des conclusions tirées de la partie précédente, ce modèle peut sembler trop élémentaire pour pouvoir re-produire les profils de propagation observés. Cependant, ce travail a été réalisé en même temps que la partie 5.2, et nous trouvons intéressant de montrer les résultats produits pour donner au lecteur une meilleure intuition de la relation entre les tailles et les ASCI des cascades. Pour chaque résultat de taille de cascade, obtenus dans le chapitre précédent, un même nombre de temps d’infection est tiré. L’ASCI est ensuite calculée sur la propagation ainsi modélisée :

— Soit l’ensemble des tailles de cascades mesurées I = {|VCd(t0,u)|, ∀(t0, u) ∈ W}, avec

W l’ensemble des couples temps-nœud de départ des cascades.

— On tire un nombre |VCd(t0,u)| de temps d’interaction t dans l’intervalle [t0, t0+ d], que l’on trie ensuite dans l’ordre croissant.

— On pose i = 0. Puis, à chaque instant de temps t, on incrémente i. On obtient alors i en fonction de t, dont on calcule l’ASCI.

En traçant l’ASCI en fonction de la taille des cascades (non représenté) , on observe une relation linéaire entre ces deux variables. Ce constat est incompatible avec les résultats de la figure 5.2 : sur cette figure, on observe une relation parabolique entre les tailles et les ASCI des cascades. Il existe donc une dynamique d’interaction, qui ne peut être expliquée simplement par un modèle où les interactions se produisent à des instants aléatoires.

5.3.2 Modèle à deux phases

Nous avons précédemment mis en évidence l’existence d’une dynamique de diffusion commune entre les propagations de toutes tailles et de toutes ASCI, caractérisée par deux régimes distincts. Nous décidons donc de tester un modèle à deux phases : l’une où la vitesse de propagation est négligeable, et l’autre où le nombre d’infectés croît linéairement. Nous ferons référence à la première phase sous le terme phase d’attente, et à la seconde sous le terme phase de croissance linéaire.

• Paramètres du modèle

Nous décidons de modéliser la phase d’attente par une vitesse de propagation nulle. Le

nombre d’infectés k1 est donc constant. La deuxième phase, à croissance linéaire, débute

après un certain temps, que nous appelons temps d’attente w. Ce temps peut être nul, autrement dit, la première phase peut être inexistante. La vitesse de propagation de cette phase est notée a. Mathématiquement, le modèle s’exprime donc de la façon suivante :

(

y = k1, si t≤ w

y = a t + k2, si t> w (5.3)

La dynamique de propagation d’une cascade peut être résumée aux paramètres k1, k2,

a, et w. La figure 5.6 montre un exemple d’approximation d’une diffusion par le modèle

à deux phases, lorsque sont fixés k1 et k2 à 1. Pour chaque cascade obtenue au chapitre

précédent, nous utilisons une bibliothèque python1 pour trouver les valeurs de a et w

per-mettant d’obtenir la meilleure modélisation de la cascade. Pour ce faire, cette bibliothèque utilise l’algorithme de Levenberg-Marquardt. Nous calculons ensuite l’ASCI à partir de ces paramètres.

La figure 5.7 montre l’ASCI en fonction du nombre d’infectés pour les cascades mesurées et pour les résultats du modèle à deux phases. On observe que le modèle permet de trouver

5.3. Modélisation de la dynamique de propagation 89

Figure 5.6 – Exemple de propagation d’un mois, et de l’approximation correspondante, obtenue avec le modèle à deux phases.

une allure en aile similaire aux résultats des mesures. Autrement dit, les paramètres du modèle à deux phases permettent de retrouver la diversité des ASCI correspondant à un même nombre final d’infectés.

Figure 5.7 – ASCI en fonction des tailles des cascades de durée d’un mois, pour le modèle à deux phases (à gauche), et pour le modèle et les mesures sur les données de 2015 (à droite).

Dans notre cas, modéliser le phénomène de saturation, couramment observé dans le contexte épidémiologique, ne semble pas essentiel pour avoir une bonne représentation de la dynamique de diffusion dans le réseau. Ceci s’explique par la durée de propagation choisie (1 mois à 1 an) : celle-ci n’est pas assez longue pour qu’un phénomène de saturation ap-paraisse. Au contraire, sur d’autres types d’interactions, par exemple des réseaux d’appels téléphoniques [Miritello et al., 2011, Peruani and Tabourier, 2011] ou de transmission de maladies humaines [Rocha and Blondel, 2012], on observe une phase de croissance explosive (superlinéaire), puis une saturation.

Pour étudier la dynamique de propagation dans la BDNI, pour des durées de diffusion d’un mois à un an, une bonne approximation est obtenue en connaissant :

— son temps d’attente avant l’accélération de la diffusion ;

— sa pente, i.e. le coefficient directeur de la droite du nombre d’infectés en fonction du temps, représentant sa vitesse de diffusion.