Apport de la vérification de la validité spatiale

Chapitre VII Mise en œuvre et validation

3. Evaluation des performances des requêtes RDL

3.2. Apport de la vérification de la validité spatiale

Afin d’évaluer l’intérêt d’ajouter une étape de vérification de la validité spatiale lors du traitement des requêtes RDL, nous avons d’abord mené des expériences permettant d’identifier des cas de figures menant à l’obtention de résultats incorrects. Plus précisément, nous avons étudié l’impact de la vitesse de déplacement du client, de la densité des objets cibles et du nombre d’opérations de jointure sur le pourcentage de résultats incorrects transmis à l’utilisateur. Dans une seconde expérience, nous mesurons le temps de vérification de la validité spatiale afin de déduire le surcoût de cette méthode. Puis, nous mesurons la réduction des coûts de communication qu’elle introduit. Notons que dans cette section, nous évaluons les performances des requêtes RDL en supposant qu’une seule requête est soumise au prototype (mono-requête). C’est dans la section 3.3 que nous considérons les cas où plusieurs requêtes sont soumises par plusieurs clients mobiles (ces requêtes sont reçues par le serveur à des taux d’arrivées différents).

3.2.1. Facteurs influençant la validité des résultats

Pour chacune des requêtes RDL citées dans la sous-section 3.1, nous avons fait varier la vitesse de déplacement du client la soumettant, tout en mesurant le pourcentage de résultats incorrects (par rapport aux résultats retournés par le SGBD). En fait, nous calculons la distance entre chaque objet cible retourné par le SGBD comme résultat de la requête et la localisation du client à la réception des données. Lorsque cette distance est supérieure à celle

précisée par l’utilisateur (e.g. 1.5 km), l’objet est considéré comme incorrect. Chaque requête est transmise par un client ayant un déplacement lent, moyen, rapide et enfin très rapide. Nous obtenons les résultats de la Figure 50.

0 1 2 3 4 5 6 7 8 9 10

Lent [10-50] Moyen [50-80] Rapide [80-110] Tres rapide [110-130]

Vitesse de déplacement du client (Km/h)

Ob je ts c ib les in c o rr ects (% ) req1 req3 req2 req4

Figure 50 : Pourcentage de résultats incorrects

La Figure 50 permet de constater que le pourcentage de résultats incorrects dépend du mouvement du client, du nombre de jointures et surtout de la densité des objets cibles. Pour des requêtes composées d’une seule jointure et interrogeant des données relatives à des objets cibles de densité peu élevée (req1), le pourcentage de résultats incorrects reste faible. Cela est valable même lorsque le client se déplace à une vitesse importante (ce pourcentage de résultats incorrects est de 0.28 % lorsque le client est lent et reste toujours inférieur à 2.5 %).

Pour la même densité d’objets, lorsque le nombre de jointures est égal à quatre (req3), le pourcentage d’objets cibles incorrects augmente. Ceci s’explique par le fait que la durée séparant l’instant d’envoi de la requête et l’instant de réception des résultats est dans ce cas plus importante, car le temps de réponse est plus grand. En fait, un volume plus important de données est manipulé et un plus grand nombre d’opérations est évalué lors du traitement de cette requête. Lorsque la durée entre l’envoi de la requête et la réception des résultats est importante, le client peut parcourir une distance plus grande, ce qui cause un pourcentage d’objets cibles incorrects plus important (lorsque le client se déplace à une grande vitesse, ce pourcentage est de 4.83 % pour la requête req3 contre 2.48% pour la requête req1).

Nous constatons également que la densité des objets cibles interrogés s’avère un facteur très déterminant. En fait, le pourcentage de résultats incorrects obtenus après évaluation de la requête req2 (densité des objets cibles de 50 objets/km2) est pour toutes les vitesses de déplacement nettement plus important que celui obtenu après évaluation de la requête req3 (densité des objets cibles de 5 objets/km2). Pourtant la requête req2 n’implique qu’une seule jointure en plus de l’opérateur de proximité. Lorsque la densité des objets cibles est importante et le nombre de jointure est égal à quatre (req4), le pourcentage de résultats incorrects atteint 8.9% pour un client se déplaçant très vite.

Ces observations nous conduisent à souligner l’importance de bien connaître, avant de développer une application basée sur la localisation, le « profil mouvement » des clients, la

densité des objets et la complexité des requêtes à évaluer (simple, moyenne, élevée). Ces éléments permettent de mieux choisir les méthodes à mettre en œuvre. Par exemple, supposons que les objets cibles soient rares (e.g. hôpitaux, mairies, musées) et que la plupart, d’entre eux se trouvent dans des centres villes. Nous pouvons nous interroger, dans ce cas, sur l’intérêt d’utiliser une méthode de vérification de la validité spatiale des résultats. En effet, puisque les objets sont rares (densité faible), la plupart des requêtes à évaluer vont être similaires aux requêtes req1 ou req3. De plus, au centre ville, la majorité des clients mobiles circulent à moins de 50 km/h. Selon nos expérimentations, le pourcentage de résultats incorrects ne dépasserait pas 1% dans ces conditions.

Notons tout de même que les facteurs présentés ici ne sont pas les seuls pouvant affecter la validité spatiale des résultats des requêtes RDL. Comme nous le montrons dans les expériences suivantes, la taille de la surface de sélection et le taux d’arrivée des requêtes peuvent aussi avoir un impact sur le pourcentage de résultats incorrects.

3.2.2. Surcoût de la méthode de vérification de la validité spatiale

Rappelons que la méthode de vérification de la validité spatiale permet de vérifier que les résultats retournés par le SGBD sont corrects vis-à-vis de la localisation du client mobile à la réception des données. Cette vérification est effectuée juste avant le transfert des résultats. Cette méthode évite la transmission des résultats erronés au client. Puisque le problème de validité des résultats se pose de manière plus significative pour des requêtes similaires à la requête req4 (pourcentage de résultats incorrects le plus élevé), nous avons mené nos expériences en évaluant cette requête. Nous supposons que le client mobile se déplace très rapidement. Pour faire varier la surface de sélection entre 0.2 entre 0.2 km2 et 200 km2 nous faisons varier son rayon. Cela correspond à un pourcentage entre 0.1% et 100% de la surface globale de travail. La Figure 51 montre le temps de vérification de la validité spatiale

TverifSpVal en fonction du pourcentage de surface de sélection par rapport à la surface globale

de travail (Work_Space). Notons que l’axe des abscisses est gradué en échelle logarithmique.

0 1 2 3 4 5 6 7 8 9 0,1 1 10 100 Surface de sélection (% ) Tem ps de vér if icat ion de l a va li d it é de s rés u lt at s ( s)

Figure 51 : Temps de vérification de la validité spatiale en fonction de la taille de la surface de sélection.

La courbe de la Figure 51 montre que TverifSpVal croît selon la taille de la surface de sélection. Ceci se justifie par le fait que le temps TverifSpVal est proportionnel au nombre d’objets cibles retournés par le SGBD. En effet, la méthode de vérification de la validité spatiale calcule la distance entre chaque objet cible et la localisation du client mobile à la

réception des résultats. Or, plus la surface de sélection est grande, plus le nombre d’objets cibles retournés est grand. Par exemple, TverifSpVal est supérieur à 8 secondes lorsque la surface de sélection est égale à la surface globale de travail et il est inférieur à 650 millisecondes lorsque la surface de sélection est inférieure à 1% de la surface globale de travail. Selon les résultats de nos expérimentations, TverifSpVal représente en moyenne 5% du temps de réponse de la requête. Celui-ci inclut, en plus, le temps de transformation, le temps de traitement de la requête par le SGBD et le temps de transfert des résultats. Comme nous le discutons dans la sous-section suivante, la méthode de vérification réduit les coûts des communications en évitant de transmettre les résultats incorrects. Ainsi, le temps de transfert en utilisant cette méthode est plus faible par rapport à une version du prototype dépourvu de cette méthode.

Ajoutons que nous avons mesuré le temps de réponse de la requête sans vérification de la validité spatiale et nous l’avons comparé à celui obtenu avec vérification de la validité spatiale. Nous avons déduit le surcoût introduit par cette méthode et nous avons observé qu’il est faible (dans tous les cas expérimentés, il reste inférieur à 3%).

3.2.3. Réduction des coûts de communication

Dans cette sous-section, nous nous intéressons à la réduction des coûts de communication introduite par la méthode de vérification de la validité spatiale. Cette métrique est calculée de la manière suivante :

100 ) 1 ( − × = DNVerif DVerifSp RCC

DVerifSp représente la quantité de données transmise à l’utilisateur après vérification de

la validité spatiale. DNVerif représente la quantité de données retournée par le SGBD (i.e. tous les résultats de la requête corrects et incorrects). Puisque la méthode de vérification de la validité spatiale ne transmet pas les résultats incorrects, RCC correspond au pourcentage de résultats incorrects déterminés avant le transfert des résultats. La Figure 52, permet de constater la réduction des coûts de communication introduite par la méthode de vérification de la validité des résultats.

0 5 10 15 20 25 30 35 40 45 50 55 60 0,1 1 10 100 Surface de sélection (% ) R é duct ion de s c oû ts de co m m u n icat io n ( % )

Figure 52 : Réduction des coûts de communication

La courbe de la Figure 52 montre que la méthode de vérification de la validité spatiale réduit davantage les coûts de communication lorsque la surface de sélection est petite. Dans ces cas, même lorsque le client se déplace très peu avant de commencer à recevoir les

résultats, cela peut avoir un fort impact sur le pourcentage de résultats incorrects. En fait, le rapport entre la distance parcourue par le client et la surface de sélection affecte le pourcentage de résultats incorrects. Par exemple, si un client mobile demande les objets cibles à 500 mètres et qu’il parcourt seulement 250 mètres avant de commencer à recevoir les résultats, le pourcentage de résultats incorrects devient très important. En effet, puisque les localisations des objets cibles sont uniformément distribuées dans la surface globale de travail, de forts risques existent pour que la moitié des résultats retournés par le SGBD soient incorrects (dans cet exemple).

Si la surface de sélection est plus grande et que la distance parcourue ne varie pas beaucoup, le pourcentage de résultats incorrects devient plus faible. Par exemple, lorsque le client demande les objets cibles à 50 km de sa position et qu’il ne parcourt que 250 mètres avant la réception des résultats, le nombre d’objets cibles retournés est plus grand alors que le nombre d’objets cibles incorrects ne change pas beaucoup. C’est pour cette raison que la réduction des coûts de communication décroît avec la taille de la surface de sélection. Les expériences menées montrent que si nous ne prenons pas en compte les cas extrêmes (surface de sélection très petite, 0.1% ou surface de sélection égale à la surface globale de travail), la réduction du coût de communication décroît lentement de 15% à 5.5%.

Notons qu’en plus de réduire les coûts de communication, la méthode de vérification de la validité spatiale permet de garantir à l’utilisateur que les résultats reçus sont corrects vis-à- vis de sa localisation à la réception de la requête.

Dans le document Traitement des requêtes dépendant de la localisation avec des contraintes de temps réel (Page 136-140)