• Aucun résultat trouvé

MAINTIEN DE LA COHÉRENCE DE LA BASE DE DONNÉES ET DE CONNAISSANCES PAROLE

N/A
N/A
Protected

Academic year: 2021

Partager "MAINTIEN DE LA COHÉRENCE DE LA BASE DE DONNÉES ET DE CONNAISSANCES PAROLE"

Copied!
5
0
0

Texte intégral

(1)

HAL Id: jpa-00230394

https://hal.archives-ouvertes.fr/jpa-00230394

Submitted on 1 Jan 1990

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

MAINTIEN DE LA COHÉRENCE DE LA BASE DE DONNÉES ET DE CONNAISSANCES PAROLE

H. Bel Bachir, J.-F. Serignat, J. Caelen

To cite this version:

H. Bel Bachir, J.-F. Serignat, J. Caelen. MAINTIEN DE LA COHÉRENCE DE LA BASE DE

DONNÉES ET DE CONNAISSANCES PAROLE. Journal de Physique Colloques, 1990, 51 (C2),

pp.C2-483-C2-486. �10.1051/jphyscol:19902113�. �jpa-00230394�

(2)

COLLOQUE DE PHYSIQUE

Colloque C2, supplément au n°2, Tome 51, Février 1990 C2-483 1er Congrès Français d'Acoustique 1990

MAINTIEN DE LA COHÉRENCE DE La BASE DE DONNÉES ET DE CONNAISSANCES PAROLE

H. BEL BACHIR, J.-F. SERIGNAT et J. CAELEN

institut de l a Communication Parlée. INP-ENSERG, Université Stendhal, Unité Associé au CNRS n° 368, 46 Avenue Félix Viallet, F-38031 Grenoble Cedex, France

RESUME - L'intérêt est porté sur le contrôle et le maintien de la cohérence de la Base de Données et de Connaissances Parole (BDC-Parole). Celle-ci, conçue à partir d'un modèle centré objet, est utilisée comme outil de recherche dans le domaine de la parole. Les conditions de validité et les sources d'incohérences sont données ainsi qu'une élaboration d'une stratégie de maintien de la cohérence sous forme interactive. L'implantation des différentes procédures de maintien de la cohérence de la base est faite à partir de règles.

ABSTRACT - We address the problem of maintaining the consistency in the data and knowledge speech "BDC-parole". The information base is used as a tool for speech research, and has been defined by a data and knowledge object-based model. In the first stage we survey the sources of inconsistency, and the overall conditions that must hold to avoid their occurrence. We propose an inconsistency control strategy which is based on a dialog with the user. We underline the advantages of a rule-based approach (flexibility and adaptability) to solve the consistency problem.

I. INTRODUCTION

Une base de données parole doit gérer simultanément des données de nature différente : le signal numérique, les étiquettes (lexicales, syntaxiques, sémantiques...), des résultats de traitements appliqués sur le signal : (spectres, intensité, etc ..). Toutes ces données possèdent des structures et des caractéristiques diverses. Ce qui explique le choix du modèle orienté objet utilisé pour la Base de Données et de Connaissances Parole (BDC-Parole) [3]. La BDC-Parole évolue au fur et à mesure de la connaissance du domaine. Cette base est complétée, graduellement, par des connaissances provenant soit directement de l'expert, soit des connaissances déduites par l'analyse des informations gérées par le système. Ceci explique la nécessité, pour la base, d'avoir un schéma dynamique. Il est nécessaire de mettre en oeuvre des mécanismes permettant de modifier la structure de la base et de mettre à jour les objets-parole. Ces modifications ne doivent pas générer des informations contradictoires [7] dans la base. La BDC-Parole comporte une partie de données (ou connaissances déclaratives) représentées par les objets et une partie connaissances déductives faisant appel à des objets particuliers (règles). Nous proposons un système de maintien de la cohérence des données de la BDC-Parole. La modélisation des connaissances de la BDC-parole étant en cours [2], [6], les problèmes induits pour le maintien de la cohérence relative aux connaissances seront étudiés ultérieurement. Nous donnons les conditions de validité de la base qui proviennent du modèle choisi. Nous précisons aussi les sources d'incohérences provenant des différentes opérations de mise à jour.

Pour chaque type d'opération, nous définissons les conditions nécessaires pour le maintien de la cohérence et élaborons une stratégie à suivre par le système : lorsqu'une requête de mise à jour risque de mettre la base dans un état incohérent, un dialogue s'installe entre l'utilisateur et le système guidant ainsi l'utilisateur vers le choix d'actions permettant le bon déroulement de la requête. Enfin nous proposons d'implémenter les procédures de mise à jour sous forme de règles. Ce qui permet d'éviter l'écriture de programmes rigides, peu évolutifs, dépendants de la structure de la base et de la stratégie choisie.

Il . PRESENTATION DE LA BDC-PAROLE.

Un objet [1] est une structure de données définie par un nom auquel est associé un ensemble de propriétés. On distingue deux catégories d'objets : les objets génériques et les instances. Cette dichotomie conduit à considérer deux relations : l'héritage [5] lie un objet générique à sa hiérarchie et l'instanciation lie une instance à son objet générique. Nous donnons dans la figure 1 un sous-graphe d'héritage, dans lequel le lien d'héritage est le lien "sorte-de".

Dans la BDC-Parole, trois types de propriétés sont associées à un objet générique: les attributs, les contraintes d'intégrité et les liens sémantiques.

a) les attributs décrivent les propriétés statiques de l'objet ou des propriétés dynamiques lors d'un attachement procédural, et sont à leur tour décrits par une liste de facettes. Ces dernières servent à déterminer le type de l'attribut, les restrictions sur le type. On remarque que la facette définissant le type d'un attribut d'un objet générique peut faire référence à un objet générique par son nom, créant ainsi une association de type référence entre les deux objets.

Article published online by EDP Sciences and available at http://dx.doi.org/10.1051/jphyscol:19902113

(3)

COLLOQUE DE PHYSIQUE

b) les liens s6mantiques sont des propriét6s de structure, ils expriment les relations avec les autres objets de la base. Nous distinguons principalement :

- les liens de composition qui expriment la provenance de l'objet.

-

les liens d'6quivalence qui s'établissent entre deux objets représentant deux aspects d'une même entité.

Nous représentons dans la figure 2 un exemple des divers liens s6mantiques.

c)les contiaintes d'int6grit6 [4] portent sur l'objet en tant qu'unit6 sémantiquement définie. Elles expriment des relations entre les attributs qui decrivent l'objet g6nérique. Ces contraintes sont exprimées à l'aide de prédicats dans I'objet g6n6rique en question.

1 j E

Pour que la base soit cohérente, elle doit satisfaire les conditions impos6es par le modèle choisi découlant des concepts d'héritage, de contraintes d'intégrité, de liens semantiques et de r6f6rence.

a) conditions induites Dar i'héritaae ;

a.1) Un objet générique hérite de toutes les propriét6s de sa hiérarchie : des attributs (sauf de ceux marqués par la facette % non-héritabie ), des contraintes d1int6grit6 et des liens sémantiques.

a.2) Les attributs hérités ne peuvent être que précisés et non redéfinis : pour un attribut donn6, le type (ou le domaine) pr6cisé doit être compatible avec celui de l'attribut defini dans sa hi6rarchie.

a.3) Des attributs distincts peuvent avoir le même nom s'ils apparaissent dans des objets génériques qui ne sont pas en relation de sp8cialisation l'un par rapport à l'autre.

a.4) Une instance d'un objet générique peut être incomplète : tous les attributs détermin6s pour l'objet n'ont pas forcément de valeur.

b) conditions induites var les contraintes d'intéarlté (CI):

b.1) Une instance d'un objet générique doit v6rifier toutes les contraintes d'int6grit6 (CI) et aussi les restrictions des facettes des attributs établies dans l'objet et dans sa hiérarchie.

b.2) Une CI définie dans un objet gén6rique X doit être vérifiée par toutes les instances de X et les instances des objets génériques spécialisant X.

b.3) Une CI ne doit pas contredire les CI existantes.

b.4) Une CI ne doit mettre en relation que des attributs existant effectivement dans la base.

c ) condition induite aar les liens sémantiaues ;

Deux instances d'objets X,Y sont liées si un lien existe entre les objets X,Y ou entre deux objets de leurs hiérarchies respectives. A tout moment, un objet (gén6rique ou instance) n'est li6 qu'avec des objets existant dans la base.

d) conditions induites par 1 a notion de reference; ,

.

d.1) Si un objet générique X a un attribut réf6rençant un autre objet gén6rique Y, alors toutes les instances de la classe de X sont liées à des instances de la classe de Y.

d.2) Tout objet référencé (générique ou instancié) doit exister dans la base.

(4)

-r

Lien de composition

Fiaure no.2 : Exemple de liens semantiques I V SOURCES D'INCOHERENCE ;

Le systbme de maintien de cohérence doit vérifier que I'exécution d'une opération ne rend pas la base incohérente. Nous supposons qu'à l'état initial la base est cohérente : elle satisfait les conditions de validité citées auparavant (à défaut, la base vide est nécessairement cohérente).

H

s'agit maintenant de donner pour chaque type d'opération les conditions de passage d'un état cohérent à un autre état cohérent. Ce sont ces conditions que le système de maintien de cohérence verifie avant i'exécution de I'op6ration. Nous distinguons les opérations de mise à jour concernant les objets génériques de celles concernant les instances, vu la nature différente des traitements.

al mise à iour d'un obiet aénériaue.

La mise à jour consiste à créer, supprimer un objet ou modifier (créer, supprimer, modifier) chacune des parties de I'objet (attributs, liens sémantiques, et /ou contraintes d'intégrité). Nous citons dans ce qui suit les opérations succeptibles de générer des incohérences : un objet générique ne peut être supprimé que s'il n'est pas instancié, s'il n'est pas lié à d'autres objets par des liens s6mantiques, et s'il n'est pas référencé par d'autres objets. Un objet générique peut être créé si ses attributs sont compatibles avec tous ceux de sa hiérarchie. De plus les contraintes d'intégrité ne doivent pas contredire ceux de sa hiérarchie. La modification d'un objet générique concerne ses attributs, ses liens sémantiques ou ses contraintes d'intégrité :

-

Suooression d'un attribut A dans un obiet abnérique )(

Un attribut A ne peut être supprimé que si I'objet X n'est pas instancié. De même il ne doit pas figurer dans des contraintes d'intégrité.

Modification de facettes d'un attribut A dans un obiet oénériaue

X.

Cette modification concerne le type de i'attribut ou ses restrictions.

es

instances (si elles existent) de I'objet générique X doivent vérifier les nouvelles contraintes formulées à travers les facettes.

ise à iour de contrainte d'intéarité (C

L'adjonct~nMd'une contrainte d'intégrité CI dans unDbjet X nécessite sa vérification au niveau de toutes les instances de I'objet générique X

.

La nouvelle contrainte doit être cohérente avec les contraintes existantes.

-

Mise à iour au niveau des liens sémantiaues ;

Un lien entre objets génériques X et Y ne peut être supprimé que s'il n'existe aucun lien entre les instances respectives.

b l Mlse à iour d'une instance :

Une instance ne peut être créée au niveau d'un objet générique X que si elle vérifie les propriétés de X et celles de sa hiérarchie. Une instance ne peut être supprimée que si elle n'a pas ét6 utilis6e pour la création d'autres instances, et n'est pas référencée par d'autres instances. La création de lien entre instances d'objets génériques X et Y ne peut se faire que si un lien conceptuel existe entre X et Y ou entre deux objets de leurs hiérarchies respectives.

V : STRATEGIE DE MAINTIEN DE COHERENCE ET MODELISATION DES OPERATIONS DE MISE A JOUR SOUS FORME DE REGLES :

Un systhme de maintien de cohérence interessant serait non..pas de rejeter toute requête impliquant une incohérence mais d'essayer de réaliser l'opération de mise B jour en question tout en remediant aux

(5)

C2-486 COLLOQUE DE PHYSIQUE

incohérences au fur et

a

mesure par des mises à jour en cascade. Cette méthodologie intéressante par sa souplesse se fera de manière interactive : le systbme de maintien de la cohérence signale 3. l'utilisateur les incohérences et sert de guide pour le choix d'actions permettant le bon déroulement de la requête. Nous avons choisi d'implémenter les différentes procédures de mise à jour sous forme de règles. Ceci a l'avantage d'éviter l'écriture de programmes rigides, peu évolutifs et dbpendants de la structure de la base. Les règles peuvent êtres modifi6es et affinées. Donnons comme exemple la requête de suppression d'un objet générique et énonçons les règles utilisées pour cette opération :

IQUo : RQ

a

V Y NOT [ référence(Y,X) OU composi(X,Y) PI ORS Supprlm-objet(X) OU équival(X,Y) ] ET instance()()

R ~ @ Q :

3 Y référence (Y,X) ALORS Supprlm-référence(Y,X)

ou Déplace-reférence(Y,Z) ou Annule-requëte.

RQUs : R4

S / _ 3 Y équival(X,Y) ALORS Supprlm-llen-équivaI(X,Y)

ou Déplace-llen-équival(Z,Y) ou Annule-reauëte.

I Q O Q : RIS,

SI 3 instance(X)

-

ALORS Supprlm-lnstance(X)

ou Déplace-lnstance(Z) ou Annule-requête.

La règle R I dont le but consiste à supprimer l'objet X, ne peut être tirée que si l'objet n'est ni référencé, ni lié, ni instancié. Si l'objet X est référencé, par exemple, c'est la règle R2 qui est tirée car sa prémisse est vraie, il s'en suit que l'utilisateur a le choix entre plusieurs actions notamment la suppression de la référence, ou le déplacement de la référence vers un autre objet, ou bien l'annulation de la requête. Dans ce dernier cas l'exécution de la requête s'arrête et toutes les actions qui ont pu êtres exécutées auparavant sont annulées. Notons qu'une action peut être l'exécution d'un autre ensemble de regles.

VI : CONCLUSIOY

Notre contribution dans cet article a été de mettre en relief les différentes causes d'incohérence dûes au modèle de données choisi dans la BDC-Parole. Nous avons vu que les notions d'héritage, de liens sémantiques, de référence et de contrainte d'intégrité peuvent entraîner des contradictions au niveau de la base, aussi avons nous donné toutes les conditions nécessaires permettant de maintenir la cohérence. Le deuxième volet de ce travail a été d'élaborer une stratégie pour le système, sous forme de dialogue avec l'utilisateur, qui gérera la base tout en sauvegardant la cohérence de celle-ci. Enfin, pour des raisons de flexibilitb et de souplesse, les opérations de mise à jour sont présentées sous forme de regles. L'approche par règles permet l'adjonction d'autres concepts par exemple I'héritage multiple qui pourrait être introduit dans la base à l'aide de modification de quelques règles.

VI1 BIBLIOGRAPHIE

[ 1 ] ADlBA M (1986) "Modeling Complex Objects for Multimedia Data bases" 5th Entity Relationship Conférence, Dijon, pp 89-1 17.

[ Z ] CAELEN J, CERVANTES O, SERIGNAT J. F, FERNANDEZ Y (1988) "Data and Knowledge b

for Speech Processing " Artificial Intelligence and Cognitive Sciences, MANCHESTER UNIVERSITY PRESS, pp. 23-47, DEMANGEOT & al.

[ 3 ] CERVANTES O (1988) " Bases de données et d'objets complexes multi-média pour la recherche sur la parole" Thèse de Docteur en informatique, INPG, grenoble.

[ 4 ] DELOBEL C, ADlBA M (1982) "Bases de Données et Systèmes Relationnels" D U NOD, informatique.

[ 5 ] DUCOURNAU R, HABlB M (1989) " La multiplicité de I'héritage dans les langages 2 objets""

Technique et Science Informatique, volume 8, n, pp 41-62.

[ 6 ] FERNANDEZ Y (1989) " Modélisation et Gestion de Connaissances pour la Parole" These INPG en cours (soutenance prévue fin 1989

[ 7 ] JOUVE M, PARENT C (1979) " Qu'est ce qu'une base de données cohérente?" Journées AFCET-IF

"Bases de données cohérentes" Paris, pp 2-26.

Références

Documents relatifs

Au processus de construction des classes peut être couplée une fonction d’interprétation qui donne la sémantique attachée à une classe (qui peut être l’ensemble des objets

Dans ce qui suit, ces deux aspects de la classication sont abordés, que ce soit pour concevoir des hiérarchies de classes (dans le cas d'un langage à objets ou d'un système de rcpo

Dans ce contexte, nous avons proposé et mis en œuvre un ensemble cohérent de méthodes afin de formaliser les connaissances d’un domaine, intégrer des données hétérogènes

Nous allons essayer de montrer dans cette troisième section que le pointage est beaucoup plus qu’un geste co-verbal, qu’il peut être considéré comme une des racines de la

est un exemple de Ptype ; ADULT or MALE est un exemple de Contexte. La Condition exprime une condition logique sur les attributs du P-type et a la même forme que les assertions

Le Foyer d’un séisme : C’est l’hypocentre C’est l’épicentre C’est le point de départ de la rupture sismique sur une faille lors d'un tremblement de terre d Point

En effet les activités spécifiques VDH et CIVDH ne sont présentes qu'à un niveau de base très faible avec les ions ammonium alors qu'elles peuvent être

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des