• Aucun résultat trouvé

Identification du nombre optimal de clusters

3.3 Mod`ele de canal pour les sc´enarios ferroviaires en tunnel

3.3.2 Identification des clusters

3.3.2.6 Identification du nombre optimal de clusters

3.3.2.6.1 Rappel du contexte

Dans le cadre de cette ´etude, nous souhaitons construire un mod`ele de canal d´edi´e `a la

simulation des environnements ferroviaires en tunnel. Celui-ci s’inspire globalement du mod`ele de canal WINNER qui est un mod`ele g´eom´etrique stochastique. Ce dernier consid`ere que les diffuseurs pr´esents dans l’environnement de propagation sont regroup´es dans des clusters (cf. figure 3.1) et que le comportement global du canal r´esulte de la contribution de l’ensemble de ces clusters. Nous rappelons que dans la terminologie du mod`ele de canal WINNER, un cluster regroupe les trajets qui arrivent avec le mˆeme retard mais des angles de d´epart et d’arriv´ee diff´erents. `A ce stade, il devient n´ecessaire d’identifier le nombre de clusters en tunnel. Nous

rappelons ici que grˆace au simulateur du canal `a trac´e de rayons 3D, nous disposons d’un ensemble de trajets (ou jeu de donn´ees) pour chaque position des antennes ´emettrices (Ex) et r´eceptrices (Rx) et que chaque trajet est caract´eris´e par sa puissance, son retard, et ses angles de d´epart et d’arriv´ee en azimut et ´el´evation. D`es lors, nous pouvons utiliser les algorithmes cit´es pr´ec´edemment pour rechercher les clusters les plus appropri´es.

3.3.2.6.2 Premi`ere d´emarche

Dans un premier temps, nous identifions un nombre optimal de clusters Nopt afin de r´ea-

liser une bonne r´epartition des trajets. Ainsi, `a chaque position p des antennes Ex-Rx, nous

disposons d’un ensemble de trajets (ou objets), caract´eris´es par cinq coordonn´ees qui sont le retard et les angles de d´epart et d’arriv´ee en azimut et ´el´evation. `A ce stade, nous appliquons l’algorithme suivant.

Nous testons plusieurs valeurs pour le nombre de clusters, allant de Nmin `a Nmax et `a

chaque fois, nous appliquons les ´etapes suivantes :

– 1re´etape : ´elimination des trajets dont la puissance est inf´erieure `a 25 dB de la puissance du trajet pr´epond´erant, `a savoir le trajet direct dans notre cas ;

– 2e ´etape : standardisation des donn´ees ;

– 3e ´etape : r´epartition des donn´ees en clusters par l’algorithme du k-means ; – 4e ´etape : calcul des indices des silhouettes (s) ;

– 5e ´etape : calcul de la moyenne des silhouettes ;

– 6e ´etape : calcul du pourcentage des trajets mal r´epartis (c’est-`a-dire les trajets pr´esen- tant une silhouette inf´erieure ou ´egale `a z´ero).

3.3.2.6.3 Analyse et synth`ese

Dans la litt´erature, la meilleure r´epartition retenue est celle qui conduit `a la plus grande moyenne des silhouettes [Elg07]. Toutefois, nous avons remarqu´e que lorsque les clusters sont tr`es proches dans l’espace de repr´esentation, alors les valeurs des silhouettes sont petites. Pour illustrer ce comportement, nous reprenons l’exemple cit´e dans la section 3.3.2.5 o`u nous avons r´eparti un ensemble de trajets en deux clusters. Cette r´epartition est jug´ee ˆetre bonne car toutes les valeurs des silhouettes sont strictement sup´erieures `a z´ero. De plus, la moyenne des silhouettes est ´egale `a 0,6. `A noter que dans le meilleur des cas la moyenne des silhouettes est ´egale `a 1 et `a -1 dans le pire des cas.

En regardant de plus pr`es les valeurs des silhouettes de la figure 3.11, nous constatons qu’il existe un objet dans le cluster 1 qui pr´esente une valeur de silhouette ´egale `a 0,12 et un autre

objet dans le cluster 2 qui pr´esente une valeur de silhouette ´egale `a 0,17. En s’int´eressant de plus pr`es aux r´esultats de la r´epartition affich´ee dans la figure 3.9(b), nous remarquons alors qu’il existe bien deux objets qui se situent `a la fronti`ere des deux clusters auxquels ils appartiennent. Ces deux objets ont la particularit´e d’ˆetre proches l’un de l’autre, ce qui implique que les fronti`eres des deux clusters sont proches. D’autres tests r´ealis´es dans le cadre de cette ´etude ont r´ev´el´e que la moyenne des silhouettes peut ˆetre ´elev´ee mˆeme lorsqu’il existe des objets mal r´epartis (c’est-`a-dire dont la silhouette est inf´erieure ou ´egale `a z´ero). Nous concluons alors que l’utilisation de la moyenne des silhouettes comme indicateur d’une bonne r´epartition est insuffisante surtout en l’absence du graphe des silhouettes. Comme dans le cas de cette ´etude,

nous ne pouvons pas nous permettre d’afficher le graphe des silhouettes `a chaque position

(la simulation dynamique est compos´ee de 29 471 simulations statiques), nous introduisons alors un nouveau crit`ere de s´election qui consiste `a calculer, `a chaque position, le pourcentage des silhouettes des objets mal r´epartis. Ici la moyenne des silhouettes est utilis´ee comme un indicateur d’espacement entre les clusters. Ainsi, le nombre optimal de clusters correspond au nombre qui permet d’obtenir la plus petite valeur de pourcentage des silhouettes de trajets mal r´epartis. Si en plus la moyenne des silhouettes est ´elev´ee, alors les clusters sont bien espac´es, dans le cas contraire les clusters sont tr`es proches.

3.3.2.6.4 Deuxi`eme d´emarche

Nous fixons maintenant un nombre de clusters pour un environnement dynamique donn´e comme c’est le cas dans le mod`ele de canal de WINNER. La d´emarche pr´esent´ee figure 3.12

permet d’identifier un nombre optimal de clusters `a chaque simulation statique. Cependant,

le nombre optimal de clusters varie le long du parcours. Ainsi, nous cherchons `a calculer un

nombre de clusters commun `a toutes les simulations statiques dans le but de respecter la phi-

losophie du mod`ele de canal WINNER .

Ainsi, `a chaque position p et pour chaque nombre de clusters n allant de Nmin`a Nmax, nous

calculons le pourcentage de trajets mal r´epartis P sp,nainsi que la moyenne des silhouettes msp,n.

Nous calculons ensuite la moyenne et l’´ecart-type des P sp,nainsi que la moyenne des msp,n (cf.

figure 3.12).

Ces trois derni`eres statistiques sont utilis´ees pour fixer le nombre optimal de clusters pour un environnement dynamique. En effet, le nombre optimal de cluster est celui pour lequel :

– l’´ecart-type des trajets mal r´epartis est minimal (plus il est petit, plus la dynamique de la courbe est faible et se situe autour de sa moyenne) ;

– la moyenne des trajets mal r´epartis est minimale (une faible moyenne signifie que tr`es peu de trajets sont mal r´epartis) ;

!"#$%&'()*+,-+ ./)*012 3*-&""0#* 3'01,0%,&20'&$1 4%5/'%0&'*)*1'+6 35"*7'&$1+,*2++'%08*'2+ ,012+"0++9::+;+7(0<-*+ =$2&'&$1+- :$115*2+6 >0"7-"+,-+=$-%7*1'0#*+,*2+'%08*'2+)0"+%5=0%'&2++*'+,*+"0+ )$?*11*+,*2+2&"($-*''*2+6 @5'($,*+,*2+ 3&"($-*''*2 >0"7-"+,-+ 4$-%7*1'0#*+,*2+ 2&"($-*''*2+AB+C >0"7-"+,*+"0+ )$?*11*+,*2+ 2&"($-*''*2+ 1 1+0""01'+,*+D)&1+;+D)0E -+6+=$2&'&$1+,*+"0+%0)*+)$F&"*+%57*='%&7* - 4$-%+7(0<-*+1+6 )2-G1 42-G1

Figure 3.12 – Illustration du principe de fonctionnement de la m´ethode propos´ee pour l’iden-

tification des clusters

– la moyenne des moyennes des silhouettes est maximale (plus elle est ´elev´ee et tend vers 1, plus les clusters sont bien espac´es).