Guide de la construction d'une base de données

ni de mettre en œuvre un système d'information. Les ensembles d'entités et de liens doivent être affinés par étapes successives en fonction des secteurs d'activités ou des domaines d'application spécifiques dans l’entreprise. Dans cette approche orientée données, il est primordial que chaque modèle de données propre à une application particulière soit réalisé en conformité avec l’architecture de données d'entreprise. C'est la voie unique pour maîtriser le développement des systèmes d'information qui s’alignent sur les objectifs à long terme de l'entreprise.

2.7 Guide de la construction d'une base de données

De l’étude préalable à la conception détaillée Dans cette section, nous récapitulons les connaissances acquises

sur la modélisation des données sous la forme d’un guide pratique. La figure 2-24 présente les dix étapes de développement dont la séquence d’exécution diffère selon les phases de réalisation d’un projet.

L'expérience pratique nous montre que, durant la phase d'étude préalable, l'analyse de données consiste à développer un modèle entité-association sommaire. Dans les phases de conception sommaire et de conception détaillée, le modèle de données sera affiné, puis traduit en un schéma de base de données relationnelle. On abordera ensuite les questions liées à la cohérence et à l’implantation de la base de données. Étudions de plus près les caractéristiques des dix étapes de développement proposées.

Les quatre étapes de l’étude

préalable Tout d'abord, dans l'analyse de données, il faut commencer par

dresser une liste de toutes les informations factuelles pertinentes.

L'activité de développement étant essentiellement un processus itératif, cette liste sera complétée et affinée en collaboration avec les

futurs utilisateurs lors des étapes ultérieures. La seconde étape vise à découvrir les ensembles d'entités et de liens et à définir leurs clés d'identification et leurs attributs. On complète le modèle entité-association en y indiquant les différents types d'entité-associations. Dans la troisième étape, on se concentre tout particulièrement sur la construction des hiérarchies de généralisation et des structures d'agrégation. Au cours de la quatrième étape, on confronte le modèle entité-association à l’architecture de données d'entreprise et on apporte au modèle les ajustements nécessaires afin de garantir le développement coordonné des systèmes d'information en harmonie avec les objectifs à long terme de l'entreprise.

Figure 2-24 Du général au détail en dix étapes de développement

La conception sommaire produit un modèle de données logique

À la cinquième étape, le modèle entité-association sera traduit en un schéma de base de données relationnelle. Les règles de passage qui ont été étudiées précédemment seront appliquées aux ensembles d'entités et de liens, aux hiérarchies de généralisation et aux structures

Les étapes de la construction d'une base de données

1. Analyse de données

2. Ensembles d'entités et de liens 3. Généralisation et agrégation

4. Conformité à l'architecture de données globale de l'entreprise

5. Schéma de base de données relationnelle 6. Normalisation

7. Intégrité référentielle 8. Contraintes de cohérence 9. Chemins d'accès

10. Structure de données physique

d'agrégation. La sixième étape a pour but d'analyser le schéma de base de données par rapport aux propriétés des formes normales. Une investigation approfondie des différents types de dépendances permet de détecter et d'éliminer des incohérences dans le schéma. Dans les septième et huitième étapes, on se focalise sur les contraintes d'intégrité. On vérifie tout d'abord les liens entre clés primaires et étrangères par rapport aux règles de l’intégration référentielle concernant les manipulations de données. On définit ensuite d’autres contraintes de cohérence, même si elles ne sont pas toutes prises en charge par un système de bases de données particulier. La spécification des contraintes de cohérence permet de mettre en œuvre des règles de validation particulières au niveau du système, évitant ainsi aux utilisateurs l'obligation de contrôler individuellement l'intégrité des données.

La conception détaillée produit un modèle de

données physique La neuvième étape vise à déterminer les chemins d'accès dans

les fonctions applicatives majeures. Il faudra analyser ici les attributs les plus fréquemment accédés dans le futur, et les rassembler dans une matrice d'accès. Établie pour l'ensemble des tables du schéma de base de données relationnelle, cette matrice nous renseigne sur le degré auquel les attributs ou combinaisons d'attributs seront sollicités par des opérations d'insertion, de mise à jour et de suppression. La conception physique des ensembles et la définition de la structure physique des données sont les préoccupations de la dixième étape. On étudie à ce stade les chemins d'accès physiques et éventuellement les étapes inverses de la normalisation (dénormalisation) en vue d'optimiser la performance des applications futures (voir chapitre 4).

La conception orientée données se complète par celle des fonctions Le guide pratique présenté en figure 2-24 est essentiellement

orienté données. Naturellement, les fonctions jouent aussi un rôle important dans le développement des systèmes d'information. C'est pourquoi, au cours des dernières années, parmi les outils CASE sont apparus ceux qui supportent non seulement la conception des bases de données, mais aussi celle des fonctions. Le lecteur qui s'intéresse aux méthodologies de développement des applications trouvera dans la prochaine section une bibliographie commentée à ce sujet.

2.8 Notes bibliographiques

Apparition du modèle entité-association

Le modèle entité-association fut introduit par les travaux de Senko et Chen (voir Chen 1976). Depuis 1979, des conférences internationales sont régulièrement organisées pour discuter des propositions d'extension et de raffinement du modèle entité-association.

Méthodes de modélisation des données

Pour modéliser les données, la plupart des outils CASE actuels offrent la possibilité de construire des modèles entité-association et de représenter graphiquement les ensembles d'entités et de liens et les types d'associations ; citons par exemple les études réalisées par Balzert (1993), Olle et al. (1988) et Martin (1990). Tsichritzis et Lochovsky (1982) présentent un aperçu d'autres modèles de données logiques.

Analyse et conception orientées objet

Booch (1993), Rumbaugh et al. (1991), Coad et Yourdon (1991) développent la conception orientée objet. Ferstl et Sinz (1991) figurent parmi les auteurs de langue allemande qui proposent l’approche orientée objet dans le développement des systèmes d’information. Balzert (1999) traite de l’analyse orientée objet en combinant les approches méthodologiques de Coad, Booch et Rumbaugh. Stein (1994) présente une étude comparative des méthodes d’analyse orientée objet. Hitz et Kappel (2002) donnent une introduction au langage UML (Unified Modelling Language), axée sur le développement des logiciels.

Généralisation et agrégation

Smith et Smith (1977) ont introduit les concepts de généralisation et d'agrégation dans le domaine des bases de données.

Ces structures étaient déjà connues auparavant dans le domaine des systèmes de bases de connaissances, par exemple pour représenter les réseaux sémantiques (voir Findler 1979).

Travaux sur les formes normales

L'étude des formes normales a contribué à l'élaboration d'une véritable théorie des bases de données dans ce domaine. Les travaux de Maier (1983), d'Ullman (1982, 1988) et de Paredaens et al. (1989) figurent parmi les ouvrages théoriques de référence sur les formes normales. Dutka et Hanson (1989), Reingruber et Gregory (1994), Simsion et Witt (2005) développent les formes normales de manière

étendue dans une présentation concise et instructive. Les travaux devenus classiques de Date (2004), d’Elmasri et Navathe (2004), de Kemper et Eickler (2001), de Silberschatz et al. (2005) consacrent une large place à la normalisation.

Architecture de données

d’entreprise Les questions touchant à l’architecture de données d’entreprise

sont traitées par Dippold et al. (2001), Meier et al. (1991) et Scheer (1991). Meier et Johner (1991), Ortner et al. (1990) définissent les tâches et les responsabilités dans l’administration et la modélisation des données. Silverston (2001a, 2001b) rassemble en deux volumes une collection de modèles de données génériques par types d’entreprises et d’industries.

Modélisation des données

Les aspects liés à la modélisation des données sont traités en profondeur dans Dürr et Radermacher (1990), Nanci et Espinasse (2001), Reingruber et Gregory (1994), Schlageter et Stucky (1983), Simsion et Witt (2005), Vossen (2000) et Vetter (1998).

manipulation des données

Dans le document Introduction pratique aux bases de données relationnelles (Page 77-82)