Estimation décentralisée des modèles de mélange

Dans cette section, nous allons décrire tout d’abord l’aspect général de notre approche. Ensuite nous montrons en résumé les différentes étapes de cette approche afin de les détailler dans les sections suivantes.

5.2.1 Aspect général

Notre proposition est un algorithme robuste décentralisé, appliqué indépendamment sur chaque nœud de réseau. Considérons l’existence d’un réseau pair-à-pair composé de n nœuds, dans lequel chaque nœudi est défini avec les propriétés suivantes :

1. un ensemble de données localesDi;

2. un modèle de mélangeMi;

3. une liste dec nœuds voisins Li;

Les modèlesMisont une condition préalable nécessaire à la réalisation de notre algorithme. Ce sont des

modèles de mélange probabilistes pouvant être obtenus par un algorithme d’estimation probabiliste, par exemple EM [28,15] ou EM variationnelle [15]. Pour la suite nous supposons que chaque ensemble de donnéesDi est modélisé par un modèle Mi localisé sur le nœudi. La figure (5.1) illustre un exemple

d’application de notre technique.

Rappelons que l’objectif principal de notre méthode est de réaliser une estimation robuste du modèle de mélange global, qui reflète la densité de probabilité de toutes les données distribuées. Nous identifions deux genres de robustesse dans notre approche :

– robustesse en terme d’estimation : Afin d’améliorer la qualité de résultats et pour réaliser un algorithme robuste en présence de modèles non fiables, il est nécessaire d’identifier et éliminer ces modèles avant d’appliquer la procédure d’agrégation ;

– robustesse du réseau : dans le réseau, les liens et les nœuds peuvent tombés en panne (défaillances). Aussi, les nœuds peuvent quitter ou rejoindre le réseau comme dans le cas du réseau pair-à-pair. Ces deux facteurs peuvent influencer fortement les résultats de l’estimation.

m

od

èle de

m

élan

ge

modèles non fiables

(doivent être éliminés)

Figure 5.1 – Schéma générale de notre algorithme proposé : d’abord, des modèles de mélange sont esti- més localement sur chaque site. Puis, ces modèles sont échangés et agrégés avec les modèles voisins, en utilisant un protocole de communication gossip. Notre méthode inclut une étape de détection et d’élimi- nation des modèles non fiables dans le processus d’agrégation.

Notre approche peut gérer ces deux problèmes. D’abord nous avons proposé une technique pour dé- tecter les modèles non fiables. Elle est appliquée pour éliminer ces modèles avant d’effectuer la phase d’agrégation. Nous avons utilisé aussi le protocole de gossip qui réalise une communication probabiliste [34,75], pour faire face au problème de défaillance et de dynamicité du réseau.

5.2.2 Différentes étapes de notre approche

Rappelons que le but de notre algorithme est d’estimer le modèle global représentant les données entières dans le réseau, en fusionnant dynamiquement les modèles locauxMi. Pour cela, chaque nœudi

itère entre les5 étapes suivantes :

– récupération des modèles deLi: chaque nœudi commence par collecter tous les modèles Mj

84 CHAPITRE 5 — Estimation décentralisée de modèles de mélange

Entrées : le modèleMi, une liste de voisinsLi, le nombre de composantesP du modèle global,

etpercent le pourcentage de modèles fiables dans le réseau

1 tant que (1) faire

2 - construire l’ensembleMvoisincomposé par le modèleMiet l’ensemble de modèles de ses

voisinsLi

3 si la convergence n’est pas réalisée alors

4 - éliminer les modèles non fiables dansMvoisinafin d’obtenirMrobuste 5 - agréger les modèles deMrobustepour réaliser le nouveau modèleM

i 6 fin

7 - mettre à jour la liste de voisins avec le Peer Sampling Service 8 fin

Algorithme 10: Processus itératif appliqué sur le nœudi

– détection des modèles non fiables : le but de cette étape est d’éliminer les modèles non fiables existant dans l’ensembleMvoisinafin de construire un ensemble robuste de modèles notéMrobuste.

L’algorithme appliqué ici est une adaptation de l’algorithme proposé dans [100]. Il se base aussi sur l’échantillonnage pour réaliser son objectif, mais les objets manipulés dans ce cas sont des mo- dèles et non pas des données. Notons que le modèle localMi du nœudi peut être aussi considéré

comme un modèle non fiable.

– mise à jour du modèle local : après la calcul de Mrobuste, le nœud i applique un algorithme

d’agrégation sur l’ensemble de modèles deMrobuste afin de construire son nouveau modèle. Pour

effectuer l’agrégation, nous utilisons la même technique proposée dans [47]. Elle fonctionne de la même façon que l’algorithme K-means : étant donné l’ensemble des modèles à agrégerMrobuste,

et le nombre de composantes du nouveau modèle P , elle consiste à regrouper les composantes similaires de Mrobuste en minimisant la divergence entre les modèles de Mrobuste et le modèle

réduit. Le modèle réduit obtenu forme le nouveau modèle du nœudi.

– application du protocole de communication gossip : le protocole gossip est par définition une technique pour diffuser aléatoirement l’information (modèle dans notre cas) dans un réseau. Il peut donc réaliser une propagation correcte du modèle Mi due à sa façon probabiliste de com-

muniquer l’information. Nous utilisons une implémentation de ce protocole : le Peer Sampling Service. Il consiste à changer périodiquement les voisins de chaque nœud, en d’autres termes la topologie du réseau. Ainsi, il accélère la convergence des modèles locaux vers le modèle global. Chaque nouvelle agrégation est effectuée sur un ensemble différent de modèles qui correspondent aux nouvelles listes de voisins.

– vérification du critère de convergence : avant de commencer une nouvelle itération, le nœudi compare son modèle avec les modèles de ses voisins. Selon les résultats obtenus, il exécute soit une nouvelle itération de l’algorithme, soit une application deP SS.

L’algorithme général et un exemple de différentes étapes sont présentés respectivement dans l’algorithme (10) et la figure (5.2). Cette figure montre bien la succession d’étapes sur le nœud (1). Après avoir estimer son modèle gaussien, le nœud(1) récupère les modèles de ses voisins. Puis, il applique une

3 5 8 9 2 4 6 7 10 1 11 3 5 8 9 2 4 6 7 10 1 11 3 5 2 4 6 10 1

d

₁ 3 5 2 4 6 10 1 3 5 2 4 6 10 1

d

b

a

c

Figure 5.2 – Exemple de notre approche robuste et décentralisée sur une partie d’un graphe du réseau : la figure (a) montre les modèles initiaux du nœud (1) et ses voisins, composé chacun par un nombre différent des composantes gaussiennes. Puis tous les modèles gaussiens deL1sont collectés par le nœud

(1), ils sont représentés par les ellipses en pointillé (figure (b)). Une technique pour la détection des modèles non fiables est effectuée sur cet ensemble de modèles : le résultat de cette détection est illustré dans la figure (b) par les modèles composés des ellipses pleines en pointillé. Ces modèles des nœuds3 et 4 sont considérés comme non fiables. Ils doivent être éliminés avant l’application de la phase d’agrégation. Les ellipses en noir dans la figure (c) représentent le nouveau modèle du nœud(1) obtenu en agrégeant les modèles restants. Enfin, le nœud(1) échange une partie de ses voisins avec le nœud (6) (figures d1et

d2), en appliquant la technique deP SS.

technique pour éliminer les modèles non fiables. Ensuite, un algorithme d’agrégation est appliqué sur les modèles restants. Le but est de générer le nouveau modèle du nœud(1). Enfin, le nœud (1) choisit un autre nœud parmi la liste de ses voisins, afin d’échanger entre eux une partie de leurs voisins. Ces étapes correspondent à une itération de l’algorithme (10) sur le nœud(1). Après la vérification du cri- tère de convergence, le nœud(1) applique seulement le P SS ou ré-exécute une itération de l’algorithme. Après avoir expliqué les étapes principales de notre algorithme, nous montrerons dans la section suivante le critère utilisé pour mesurer la similarité entre les modèles de mélange.

86 CHAPITRE 5 — Estimation décentralisée de modèles de mélange

3

5

2

4

6

10

1

Figure 5.3 – Cette figure présente une partie du graphe d’un réseau coupé au niveau du nœud(1). Les ellipses en pointillé sur chaque nœud représentent les modèles correspondants. Le nœud(1) possède ici une liste de6 voisins. Nous allons voir après, comment est obtenu le modèle global sur cet exemple.

5.2.3 Similarité entre les modèles de mélange gaussien

Dans notre algorithme, nous avons besoin de calculer la similarité entre les mélanges gaussiens tout au long de l’exécution des étapes2 et 3 de notre algorithme (10). En effet, les mélanges gaussiens doivent être comparés entre eux afin de :

– identifier les modèles non fiables (étape2 du l’algorithme (10)). Pour cela, chaque nœud collecte dans un premier temps les modèles de ses voisins. Puis il cherche à trouver parmi eux ceux qui s’écartent le plus par rapport à la majorité des modèles. Cela nécessite de calculer la similarité entre chaque paire de modèles collectés ;

– réaliser la phase d’agrégation (étape3 du l’algorithme (10)). Cette phase a pour but de réduire un modèle de mélange en un autre modèle avec un nombre plus petit de composantes. Elle nécessite aussi le calcul de similarité entre les modèles originaux et le modèle réduit.

Nous avons proposé la divergence de Kullback-Leibler (mesure fondamentale entre les modèles de mélange), comme un critère de similarité entre les mélanges gaussiens. Ce critère qui a été présenté en détail dans le chapitre3 (section3.3) va être rappelé dans ce chapitre. Nous avons vu que la divergence de KL n’existe pas sous forme déterminée entre deux mélanges gaussiens, et que plusieurs approximations ont été proposées pour calculer cette divergence. Notre choix s’est porté sur la méthode de match bound [45] pour calculer l’approximation de KL entre les mélanges gaussiens. L’utilisation de cette approximation était motivée par sa complexité de calcul réduite (seuls les paramètres des modèles sont requis). Nous proposons ainsi de réutiliser ce critère afin de calculer la similarité entre les mélanges gaussiens.

En résumé, la méthode de match bound consiste à calculer la divergence entre deux mélangesf et g comme suit : KLmatch(f ||g) = X i πfi KL(fi||gm(i)) + log πfi πgm(i) ! , (5.1)

oùπfi etπgm(i) sont respectivement les probabilités a priori des composantesfi etgm(i).m est la fonc-

tion de correspondance entre les différentes composantes def et g définie par l’équation (3.15).KL est la divergence entre deux composantes gaussiennes calculée selon l’équation (3.13).

Pour résumer, ce critère est utilisé comme une mesure de similarité entre les mélanges gaussiens afin de réaliser la détection des données non fiables et l’agrégation des modèles. Dans la section suivante, nous montrerons comment sont détectés les modèles non fiables.

Dans le document Estimation robuste des modèles de mélange sur des données distribuées (Page 93-98)