• Aucun résultat trouvé

3.3 D´ elimitation des nuages de points (clustering)

3.3.5 Superparamagnetic clustering

Un algorithme de clustering superparamagn´etique, fond´e sur la simulation d’inter- actions entre les points zj des donn´ees et ses L plus proches voisins, a r´ecemment ´et´e propos´e (Quian Quiroga et al., 2004). Il s’agit d’un algorithme non supervis´e qui ne n´ecessite pas la d´etermination a priori du nombre de nuages.

Plus pr´ecis´ement, les auteurs impl´ementent un algorithme introduit par Wolf pour la simulation des mod`eles d’Ising `a temp´erature critique utilisant un mod`ele d’interaction entre deux points “proches voisins” zi et zj. Un point zi poss`ede L proches voisins : les

L points dont les distances euclidiennes `a ce point sont les plus petites. L’interaction entre deux proches voisins, not´ee Jij est une fonction exponentiellement d´ecroissante

du carr´e de la distance euclidienne entre ces deux points. Initialement, chaque point zj

des donn´ees est dans un ´etat sj, parmi q possibles. Un point zi est choisi al´eatoirement et son ´etat si est remplac´e par un nouveau, snew, pris al´eatoirement entre 1 et q. On

essaie ensuite de changer l’´etat des proches voisins de zi. La probabilit´e qu’un proche voisin zj de zi passe ´egalement dans l’´etat snew est donn´ee par :

pij = 1 − exp  −Jij T δsi,sj  (3.30) o`u T est la temp´erature (il s’agit d’une temp´erature formelle introduite par analogie avec les syst`emes magn´etiques en physique statistique) et δsi,sj est le symbole de Kroe-

necker (δsi,sj = 1 si si = sj et 0 sinon). Ainsi, seuls les proches voisins qui ´etaient dans

le mˆeme ´etat que zi sont candidats `a un changement de leur ´etat vers l’´etat snew. Un

proche voisin de zi ne peut changer d’´etat qu’une seule fois au cours de cette it´eration de l’algorithme. Au cours de cette mˆeme it´eration, on essaie de changer, selon la mˆeme probabilit´e 3.30, les ´etats des proches voisins des proches voisins de zi qui ont chang´e

d’´etat (i.e les proches voisins “au carr´e”), jusqu’`a ce que plus aucun changement ne soit possible. On s´electionne alors au hasard un autre point zi0 et on r´eit`ere la proc´edure

de mise `a jour en cascade des ´etats des proches voisins pour ce nouveau point. On r´ea- lise N it´erations selon cette proc´edure, `a diff´erentes temp´eratures. Les points qui sont proches, au sens de la distance euclidienne (Jij grand et pij proche de 1), ont tendance

`

a changer d’´etat simultan´ement et correspondent `a un nuage. Il suffit donc de quantifier la corr´elationδsi,sj et d’associer zi et zj dans un mˆeme nuage siδsi,sj ≥ θ, o`u θ est

un seuil pr´ed´etermin´e.

L’effet de la temp´erature sur cette dynamique est ´evident. A basse temp´erature, la probabilit´e de changer simultan´ement les ´etats des proches voisins est grande, quelle que soit la force de leur interaction (i.e quel que soit leur ´eloignement) ; tous les points des donn´ees ont tendance `a changer d’´etat en mˆeme temps. C’est analogue `a la phase ferromagn´etique d’un verre de spins. Tous les points sont consid´er´es comme appartenant au mˆeme nuage. A l’inverse, `a haute temp´erature, la probabilit´e de changer simultan´e- ment les ´etats de deux proches voisins est faible ; les points des donn´ees changent d’´etat al´eatoirement, quelle que soit la force de leurs interactions. Cela correspond `a la phase paramagn´etique d’un verre de spin. Les donn´ees sont alors partag´ees en de nombreux nuages ne contenant que quelques points chacun. Dans une gamme interm´ediaire de temp´erature, seuls les points group´es en nuages changent d’´etat simultan´ement (phase superparamagn´etique). En r´ealisant la simulation d´ecrite ci-dessus sur tout une gamme de temp´erature, on peut explorer les trois phases mentionn´ees. Sur un certain inter- valle de temp´erature, la taille des nuages, ainsi que son nombre, restent stables. C’est la phase superparamagn´etique. On peut utiliser la partition des donn´ee obtenue dans cette phase pour d´eterminer le nombre de nuages (i.e neurones) et l’appartenance des points (i.e PAs) `a ces nuages.

Cet algorithme de clustering pr´esente l’avantage de ne pas n´ecessiter la fixation du nombre de nuages a priori. Cependant, la d´etermination de ce nombre, une fois les simulations `a diff´erentes temp´eratures r´ealis´ees, n´ecessite, en pratique, un choix de la part de l’exp´erimentateur. En effet, celui-ci doit d´eterminer la temp´erature T0 de

simulation qui a r´ealis´e la bonne partition des donn´ees. Ce choix repose en grande partie sur la taille des nuages (i.e le nombre de points - PAs - par nuage) qui refl`ete la fr´equence de d´echarge des neurones. La partition `a retenir est celle dont les tailles de nuages correspondent aux fr´equences de d´echarge que l’exp´erimentateur attend. On

voit donc poindre la faiblesse de la m´ethode dans le cas o`u des neurones d´echargent `a des fr´equences tr`es diff´erentes : pour pouvoir autoriser une faible fr´equence de d´echarge (un nuage contenant peu de points), l’exp´erimentateur doit consid´erer une simulation `

a haute temp´erature, interdisant de fait la pr´esence de nuages contenant beaucoup de points (haute fr´equence de d´echarge). Autrement dit, l’algorithme tend `a homog´en´eiser les tailles des nuages `a une temp´erature donn´ee. Cette m´ethode de d´elimitation des nuages est donc relativement faible lorsque des neurones de fr´equences tr`es diff´erentes sont pr´esents dans les donn´ees. Le comportement de cette m´ethode dans un tel cas reste `

a ˆetre d´emontr´e puisque les donn´ees simul´ees par les auteurs pour la tester comportent trois neurones ayant des d´echarges Poisson de mˆeme fr´equence.