• Aucun résultat trouvé

Chapitre 4 : Une approche de la découverte sémantique des SWG basée

5.3 Représentation formelle de la qualité

Pour assurer un « matching » efficace entre les critères de qualités des catégories des SWG et ceux de la requête utilisateur, nous proposons une représentation formelle de la notion de qualité comme suit :

5.3.1 Qualité des catégories des SWG

La qualité est représentée par un ensemble de critères. Cet ensemble contient trois type de critères à savoir : les critères de données, de services et d'usage. Chaque critère est représenté par par une ou plusieurs dimensions ou chaque dimension a un poids. Ce dernier représente l'importance de la dimension pour la catégorie de service. La notion de qualité peut avoir la représentation formelle suivante:

• Q= Qd U Qs U Qu : représente la qualité globale de la catégorie

• Qd : représente les critères de qualité des données tel que Qd = {Di (Nom,Poids) i:1..N }

• Qs : représente les critères de qualité des services tel que Qs= {Di (Nom,Poids) i:1..M }

• Qu : représente les critères de qualité des données tel que Qu = {Di (Nom,Poids) i:1..P }

le poids attribué à D représente le degré d’importance de la dimension, il est entre 0 et 1.

• Qd, Qs et Qu sont disjoints

• La relation sémantique entre les différentes dimensions d'une qualité est assurée à travers une ontologie de concepts de qualité.

5.3.2 Qualité de la requête utilisateur

La qualité de la requête utilisateur représente les besoins de l'utilisateur sous forme de critères de qualité. Elle a une représentation formelle similaire à celle utilisée pour la qualité des catégories des SWG en ajoutant un autre élément important (seuil) à travers lequel la dimension qualité sera acceptée ou non. Donc la qualité de la requête utilisateur est formalisée comme suit :

• Q= Qd U Qs U Qu : représente la qualité globale de la catégorie

• Qd : représente les critères de qualité des données tel que Qd = {Di (Nom, Poids, Seuil) i:1..N }

• Qs : représente les critères de qualité des services tel que Qs= {Di (Nom, Poids, Seuil) i:1..M }

• Qu : représente les critères de qualité des données tel que Qu = {Di (Nom, Poids, Seuil) i:1..P }

• le poids attribué à D représente le degré d’importance de la dimension, sa valeur est entre 0 et 1, le seuil représente la valeur au delà cette dimension sera acceptée.

Optimisation de la découverte sémantique des SWG à base de qualité

Page 127 • Qd, Qs et Qu sont disjoints

• La relation sémantique entre les différentes dimensions d'une qualité est assurée à travers une ontologie de concepts de qualité (même ontologie utilisée pour la qualité des catégories des SWG).

5.3.3 Méthodes d’évaluation de la qualité

Pour évaluer la qualité globale nous faisons appel aux méthodes d'évaluation de qualité

inspirée des travaux de la recherche d'information. Parmi les méthodes d’analyse multicritères les plus connues nous pouvons citer [HAR05] :

• la méthode SAW (Simple Additive Weighting): est une méthode multicritère caractérisée par une agrégation additive des critères par sommation pondérée.

• la méthode TOPSIS (Technique for Order Preference by Similarity to Ideal Solution): est une méthode multicritère développée par Hwang et Yoon (1981) se basant sur une relation de dominance qui résulte de la distance par rapport à la solution idéale. Elle se caractérise par une agrégation compensatoire entre les critères

• la méthode AHP : l’analyse procédurale hiérarchique AHP (Analytic Hierarchy Process), développée par Thomas Saaty (1971), est une méthode de prise de décision qui décompose le problème en structure hiérarchique de choix ou objectifs, par la suite en réduisant les décisions complexes en séries de simples paires de comparaison et en synthétisant les résultats.

• la méthode DEA (Data Envelopment Analysis): est une méthode introduite par Thomas Charnes, Cooper et Rhodes (1978). Cette méthode détermine le degré d’efficacité d’une solution en résolvant un programme linéaire, pour trouver la valeur optimale. Dans la méthode DEA les variables du programme sont les poids des critères qui ne sont pas spécifiées par l’utilisateur.

Dans notre travail les préférences utilisateur sont exprimées essentiellement par une affectation de poids aux dimensions de la qualité et la stratégie d’évaluation de la qualité repose essentiellement sur le calcul de score de la qualité des dimensions à partir des scores des sous dimensions. En se basant sur la comparaison de Naumann [NAU98] et l’étude de complexité de Burgess [BUR03], le choix de la méthode de calcul se fait selon les propriétés suivantes :

• interaction : l’utilisateur peut exprimer des préférences sur les critères (affectation d’un poids numérique aux critères de qualité).

• dominance : une source d’information domine l’autre si elle est égale ou meilleure pour tous les critères et meilleure au moins pour un critère.

Page 128 • type de résultat : on distingue deux types de résultats : ordonnancement (score de qualité)

ou classement.

• critères positifs et négatifs : la méthode distingue entre les critères négatifs (prix, début réseau, temps de réponse…) et les critères positifs (disponibilité, complétude …).

• complexité : la complexité de l’algorithme de calcul de scores de qualité.

Propriété SAW TOPIS AHP DEA

Interaction Poids Poids Décisions - Dominance Oui Oui Oui Oui Type de résultat Ordonnancement Ordonnancement Ordonnancement Classement Critères positifs et

négatifs

Oui Non Non Non

Complexité O(n,m) O(n,m) Exponentielle polynomiale Tableau 14: Comparaison des méthodes d’analyses multicritères [HAR05].

5.3.3.1 La méthode SAW (Simple Additive Weighting)

L’algorithme de calcul de score dans la méthode SAW se décompose en trois étapes :

Étape 1 : création de la matrice de décision

La première étape est la création de la matrice de décision qui représente les données disponibles et les critères de qualité (tableau 15).

Critère Alternatives C1 C2 … Cn Poids Alternatives W1 W2 … Wn A1 D11 D12 … D1n A2 D21 D22 … D2n … … … … … Am Dm1 Dm2 … Dmn

Tableau 15: Matrice de décision de la méthode SAW

Ai est la iéme alternative, Cj est le jéme critère et dij est la mesure de la performance de la iéme alternative pour le jéme critère. Dans notre travail, les critères sont les dimensions, et les alternatives sont les catégories des SWG.

Étape 2 : création de la matrice de décision normalisée

Cette étape consiste à normaliser les poids et les mesures de performance afin d’obtenir des valeurs entre 0 et 1. La normalisation se fait selon les formules suivantes :

Optimisation de la découverte sémantique des SWG à base de qualité

Page 129

Étape 3 : calcul du score de chaque alternative.

Le score de qualité de chaque alternative est donné par cette formule :