• Aucun résultat trouvé

2.3 Les m´ ethodes de d´ eveloppement des SID

2.3.2 D´ emarche ascendante

Dans cette section, nous pr´esentons les m´ethodes bas´ees sur une d´emarche ascen-dante en expliquant comment elles d´ecrivent un sch´ema multidimensionnel `a partir d’un sch´ema entit´e-association ou d’un sch´ema UML.

Dans [Golfarelli and Rizzi 1998b], les auteurs proposent de d´eriver `a partir des sources de donn´ees entit´e-association ou relationnelle, le sch´ema du SID qui respecte leur mod`ele conceptuel de donn´ees DFM. La m´ethode propos´ee repose en partie sur un algorithme. Les concepts de faits, de dimensions, d’attributs et de hi´erarchies sont d´efinis. Le fait est d´efini comme une entit´e ou une association entre plusieurs enti-t´es fr´equemment mises `a jour et repr´esentant un int´erˆet premier de l’organisation. Chaque fait devient la racine d’un arbre dont les noeuds sont les attributs de l’entit´e (fait candidat) et des entit´es li´ees suivant l’algorithme. Ce dernier tient compte uni-quement des relations 1-N car les relations N-M ne sont pas ´evalu´ees. Sur cet arbre, des ´elagages et des greffes des branches non guid´es sont r´ealis´es afin que les donn´ees contenues dans l’arbre soient pertinentes par rapport `a l’application. Puis, les di-mensions sont d´efinies en consid´erant les noeuds fils, de la racine de l’arbre raffin´e. Par la suite, les mesures des faits sont d´efinies `a partir des attributs num´eriques de l’arbre. Un fait peut ne pas avoir d’attribut. Enfin, les attributs qui composent une hi´erarchie sont d´efinis s’il existe une relation 1-N entre un noeud et ses descendants. A cette ´etape de la m´ethode, il est encore possible de raffiner l’arbre pour ajouter des niveaux. La m´ethode suppose que les concepteurs d´ecisionnels connaissent tr`es bien le domaine d’activit´e pour r´ealiser les ´elagages et les greffes.

Dans [Cabibbo and Torlone 1998, 2000], la m´ethode vise `a construire le mod`ele multidimensionnel MD d´efini par ces auteurs `a partir d’un sch´ema entit´e-association pr´esentant une vue int´egr´ee des bases de donn´ees transactionnelles. La m´ethode est compos´ee de quatre ´etapes :

1. la d´efinition des faits et des dimensions suite `a une analyse globale et manuelle des sch´emas sources,

2. la restructuration du sch´ema entit´e-association des sources pour faire appa-raˆıtre les faits et les dimensions, et les niveaux hi´erarchiques,

3. la d´erivation du graphe dimensionnel `a partir du sch´ema entit´e-association restructur´e. Le graphe dimensionnel est un sch´ema entit´e-association ´etendu, 4. la transformation du graphe dimensionnel dans un sch´ema multidimensionnel

MD.

Dans [Husemann et al. 2000], les auteurs proposent de d´efinir le sch´ema du SID suivant le mod`ele multidimensionnel propos´e par ces mˆemes auteurs. Cette m´ethode utilise un acquis des m´ethodes de conception des syst`emes d’information classiques qui est la d´efinition des d´ependances fonctionnelles pour d´eterminer les concepts multidimensionnels. Cette m´ethode comprend les ´etapes :

– la sp´ecification et l’analyse des besoins : apr`es le choix des sources de donn´ees pertinentes par les utilisateurs, les concepteurs d´ecisionnels accompagn´es de ces derniers doivent d´eterminer le caract`ere optionnel et le niveau d’importance m´etier des attributs. En sortie de cette ´etape, il y a le sch´ema semi-formel des concepts multidimensionnels et une sorte de dictionnaire listant les caract´ eris-tiques des attributs. Le sch´ema semi-formel est d´efini `a partir des d´ependances fonctionnelles entre les mesures d´efinies par les d´ecideurs et les attributs d´efinis dans le dictionnaire. Pour chaque mesure un sous-ensemble minimal d’attri-buts est d´efini. Ce sous-ensemble permet de d´efinir les niveaux les plus fins des hi´erarchies. A chaque ´el´ement du sous-ensemble est associ´e une dimension. Les d´ependances fonctionnelles qui ont le mˆeme ensemble de d´epart d´efinissent les mesures qui composent un fait. Pour d´eterminer les hi´erarchies au sein d’une mˆeme dimension, il faut utiliser les d´ependances fonctionnelles entre les attri-buts des dimensions et construire un graphe direct. Les attriattri-buts faibles des dimensions sont les attributs qui ont ´et´e d´efinis comme optionnels.

– la mod´elisation conceptuelle : le sch´ema semi-formel est transform´e en un sch´ema conceptuel multidimensionnel. Ce sch´ema pr´esente chaque fait avec leurs mesures et les dimensions li´ees.

Cette m´ethode utilise les d´ependances fonctionnelles pour d´eterminer les faits et les dimensions ; ce qui permet une d´efinition formelle de ces concepts. Cependant, elle sugg`ere la participation des utilisateurs pour la d´esignation des sources de donn´ees pertinentes alors que les utilisateurs, par d´efinition, ne maˆıtrisent pas les sch´emas des sources de donn´ees.

Dans [Moody and Kortink 2000], les auteurs proposent de construire un sch´ema en ´etoile ou ses diff´erentes variantes (flocon, constellation) en utilisant la d´emarche utilis´ee pour la conception d’un mod`ele entit´e-association telle que Merise. Les au-teurs mart`elent que le paradigme entit´e-association peut ˆetre utilis´e aussi bien pour la construction des syst`emes d’information classiques que des SID. Cependant, la m´ethode repose sur trois ´etapes (« la classification des entit´es », « l’identification des hi´erarchies » et « la production des mod`eles multidimensionnels des magasins de donn´ees ») qui ´evoquent les sources transactionnelles, le processus d’extraction des donn´ees, l’entrepˆot de donn´ees, les processus de chargement des donn´ees de l’entrepˆot vers les magasins, les magasins et les utilisateurs finaux. Les diff´erentes ´etapes pour la mise en place compl`ete du SID ne sont pas explicit´ees. Par ailleurs,

les auteurs pr´esentent la construction de sch´emas de magasins de donn´ees en quatre ´etapes :

– classification des entit´es en trois cat´egories entit´es de transaction, entit´es com-posantes, entit´es de classification,

– identification des hi´erarchies : une hi´erarchie est d´efinie comme une s´equence d’entit´es reli´ees par des associations 1-N, toujours ordonn´ees dans le mˆeme sens. L’entit´e li´ee au niveau le plus fin de la hi´erarchie est caract´eris´ee par une absence de relation 1-N avec une autre entit´e. L’entit´e associ´ee au niveau le plus ´elev´e est caract´eris´ee par une absence de relations N-1 avec d’autres entit´es,

– d´efinition du sch´ema dimensionnel : les diff´erents sch´emas d´eriv´es du sch´ema en ´etoile obtenu sont construits par l’application de deux op´erations. La premi`ere op´eration est la fusion entre deux niveaux d’une hi´erarchie nf (niveau fin) et na (niveau agr´eg´e). Elle consiste `a inclure na dans nf. La seconde op´eration est l’agr´egation. Elle consiste `a agr´eger une entit´e pour obtenir des donn´ees agr´eg´ees,

– ´evaluation et raffinement du sch´ema dimensionnel : cette derni`ere ´etape a pour objectif d’am´eliorer le mod`ele. Par exemple, en regroupant les faits qui ont les mˆemes cl´es.

Cependant, seules les relations 1-N sont prises en compte.

Synth`ese des m´ethodes bas´ees sur une d´emarche ascendante

La d´emarche ascendante a pour objectif de pouvoir r´epondre `a l’ensemble des requˆetes et des analyses possibles sur les donn´ees des sources et ainsi d’anticiper les besoins futurs. L’avantage de cette d´emarche est qu’elle repr´esente exactement la s´emantique sous-jacente des sources de donn´ees et elle facilite la d´efinition des hi´erarchies. Cependant, le p´erim`etre des donn´ees des sources est parfois trop large et l’´etude des sch´emas des sources requiert du temps et des ressources humaines importantes. Cette d´emarche s’av`ere lourde lorsque le nombre de sources ou la com-plexit´e des sources sont importants. Elle se base sur l’assertion id´ealiste que toutes les donn´ees sont contenues dans le sch´ema des sources alors que les donn´ees des sources peuvent ˆetre insuffisantes pour r´epondre aux besoins utilisateurs [Gardner 1998;List et al. 2000]. Elle pr´esente l’inconv´enient majeur de ne pas prendre en compte les be-soins des d´ecideurs car le sch´ema du SID d´efini ne r´epond pas forc´ement aux besoins des utilisateurs.

De plus, ces m´ethodes permettent la mise en place d’un seul module qui est l’entrepˆot de donn´ees ou le magasin de donn´ees et elles ne guident pas les concep-teurs dans le choix de l’architecture d´ecisionnelle. Elles ne couvrent donc pas tout le processus de d´eveloppement des SID. Par ailleurs, elles d´ebutent par une d´efinition qualitative des mesures ou encore par la d´efinition des mesures par les d´ecideurs. La premi`ere proc´edure n’est pas pr´ecise. La seconde rencontre des limites car elle requiert que les utilisateurs se r´ef`erent aussi aux sch´emas entit´e-association alors que ces derniers n’ont pas pour objectif d’ˆetre compr´ehensibles par les utilisateurs [Divin´e 1982].

Qui plus est, ces m´ethodes se focalisent sur la mod´elisation des donn´ees et elles n’abordent pas la dynamique du SID.