• Aucun résultat trouvé

Ce chapitre permet de boucler sur la biologie moleculaireet montre, s'il en etait besoin, que la formalisation des cartes peut ^etre realisee dans ce formalisme; il montre surtout, a partir d'un exemple, comment cette instanciation se fait.

5.1 Partie descriptive

Les formules et tableaux qui suivent montre une correspondance possible (et non exhaustive) entre les entites de nies dans la section precedente et la realite biologique. De nissons d'abord les ensembles de la typologie, P l'ensemble des points de vue, T

l'ensemble des types et U l'ensemble des unites:

P =fgenetique, physique, cytogenetiqueg

T = fgene, marqueur, sequence, site de restriction, bande cytogenetique, intron, exon, :::g

U = fcentiMorgan, kilobase, % de longueur du chromosomeg

La fonction const se decrit par un tableau a double entree: elle indique les types constitutifs associes a tout type et a tout point de vue.

const genetique physique cytogenetique

carte fgene, marqueur, carteg fgene, sequence, site, carteg fgene, bande, carteg

gene ; fintron, exong ;

marqueur ; ; ; sequence ; f:::g ; site ; ; ; bande ; ; fbandeg intron ; ; ; exon ; ; ;

De m^eme, la fonction dim est decrite dans le tableau suivant; le symbole  indique une dimension ponctuelle du type considere dans un point de vue donne, le signe $ un

intervalle. Quand aucun symbole n'est visible, le type n'a pas d'existence dans le point de vue.

dim genetique physique cytogenetique carte $ $ $ gene  $  marqueur  sequence $ site  bande $ intron $ exon $

En n, les fonctions unit etadd sont telles que:

unit(genetique) = centiMorgan;

unit(physique) = kilobase;

unit(cytogenetique) = % de longueur du chromosome;

add(centiMorgan) = faux;

add(kilobase) = vrai;

add(% de longueur du chromosome) = vrai.

Les ensembles de relations ont ete de nis dans la section 4.1 sur les requ^etes; rappe-lons les pour memoire:

Q +

l = favant, apres, recouvre avant, recouvre apresg.

Q ,

l =fcontient,contenu dans, disjoint de, non disjoint de, ordre, m^eme orientation, orien-tation opposeeg.

Considerons alors les cartes de la gure 5.1; le chromosome se decompose dans les di erents points de vue. La partie entouree d'un cercle correspond a la sous-cartecarte1. Celle-ci se decompose egalement en diverses entites. La carte cytogenetique comporte des elementsqui lui sont propres, les bandes cytogenetiques, qui se decomposent recursivement en sous-bandes.

Le tableau suivant indique la decomposition e ective des entites visibles sur la carte, en donnant les valeurs de la fonction desc. Les types des entites satisfont bien s^ur les contraintes descriptives de la fonction const. Ainsi, par exemple, le gene D1S21 n'a pour constituants dans le point de vue physique que des entites des types intron et exon.

5.2 Les relations

Les cartes de la gure 5.1 contiennent des informations qualitatives et quantitatives. Les premieres ne permettent pas d'ordonner integralement les entites, il existe en e et

5.2 Lesrelations 53 Exon3 Exon2 Intron1 Intron2 Exon1 AMY2B D1S14 PGM1 TSHB D1S19 D1S17 D1S21 D1S10 D1S39 D1S21 PGM1 Sst II

Carte Carte Carte

KiloBase centiMorgan 6.5 9.1 2.7 3.2 2.6 1.9 Eag I Not I Nae I Xho I % longueur 13.2 22.1 22.2 22.3 31.1 21 13.3 13.1 31.3 31.2

physique génétique cytogénétique

Figure5.1 - :Integration de di erentes cartes genomiques.Commentrepresenter, a l'aide du formalisme propose, leur organisation et les relations qui permettent de positionner les entites?

des incertitudes sur les positions de D1S10 et D1S39. De m^eme, la position de TSHB sur la carte cytogenetique n'a pour resolution qu'une bande (la bande 13); la connaissance disponible ne permet pas de decider a quelle sous-bande ce gene appartient. Les relations quantitatives visibles sont limitees a la carte genetique; d'autres qui n'apparaissent pas explicitementsont les longueurs des bandes vis-a-vis de la longueur totale du chromosome.

desc genetique physique cytogenetique

chromosome fcarte1,:::g fcarte1,:::g fcarte1,:::, 13, 21, 22, 31,:::g fD1S10, D1S14, D1S17, fD1S21, PGM1, XhoI, fPGM1, AMY2B,

carte1 D1S19, D1S21, D1S39, NotI, NaeI, TSHBg

PGM1, AMY2B, TSHBg SstII, EagIg

D1S21 fintron1, intron2,

exon1, exon2, exon3g

D1S14 ::: ::: :::

::: :::

13 f13.1, 13.2, 13.3g

22 f22.1, 22.2, 22.3g

Les relations qualitatives orientees, elements de R +

q uali, sont les triplets suivants: t2Q + l e 1, e 2 2E e2E avant (TSHB, D1S14) carte1 avant (D1S14, AMY2B) carte1 recouvre avant (D1S39, D1S10) carte1 apres (D1S21, NotI) carte1 apres (NotI, PGM1) carte1 apres (PGM1, AMY2B) carte1 avant (EagI, SstII) carte1 avant (SstII, PGM1) carte1 avant (exon1, intron1) D1S21 avant (intron1, exon2) D1S21 avant (exon2, intron2) D1S21 avant (intron2, exon3) D1S21

:::

Les elements de R ,

q uali apparaissent dans le tableau suivant: t 2Q , l e 1 ;e 2 2E contenu dans (22.1, 22) contenu dans (22.2, 22) contenu dans (22.3, 22) contenu dans (TSHB, 13) contenu dans (AMY2B, 21) contenu dans (PGM1, 22.2)

En n, pour nir, les relations quantitatives se retrouvent dans le tableau suivant:

p 1

;p 2

2Pos dist incert point de vue (orig(D1S21), orig(D1S17)) 9.1 0 genetique (orig(D1S17), orig(D1S19)) 3.2 0 genetique (orig(D1S21), orig(D1S10)) 8.5 3.1 genetique

5.3 Quelques requ^etes

Un exemplede requ^ete sur la composition de la carte peut ^etre:L'intron 2 appartient-il recursivement a la sous-carte 1?, ce qu'on peut ecrire intron2 2

r ec carte1. Cette requ^ete aura pour reponse vrai puisqu'il existe un chemin de composition partant de carte1 et menant a intron2, qui transite par D1S21.

5.3 Quelquesrequ^etes 55 Une requ^ete plus complexe, qui necessite d'utiliser un mecanisme d'inference, est:

Quelle est la position de D1S21 par rapport a AMY2B?. Pour repondre a cette in-terrogation, il faut introduire deux entites auxiliaires et utiliser la table de transitivite; en e et D1S21 se trouve apres NotI, qui lui-m^eme est apres PGM1, qui se situe apres AMY2B. En appliquant deux fois la table de transitivite, on infere que D1S21 est apres AMY2B. Remarquons que les inferences ont ete realisees sur les di erents points de vue, et que la connaissance sur la carte genetique seule n'aurait pas su. Il a fallu introduire le site de restriction NotI pour faire le lien entre D1S21 et PGM1. C'est pour de telles in-ferences que l'integration des di erentes cartes est pro table. L'algorithme de generation d'ordres locaux (Cf. section 4.2.3) aurait trouve cette relation puisqu'il applique la table de transitivite jusqu'a ce que plus aucune nouvelle relation ne soit inferee.

Par contre, il est des requ^etes auxquelles l'algorithme ne pourra pas repondre; ce sont toutes celles qui font intervenir des relations quantitatives. Par exemple, il est manifeste que D1S10 est apres D1S19, car ce dernier est a une distance de 9:1 + 3:2 = 12:3 de D1S21, tandis la distance separant D1S21 et D1S10 est au plus de 8:5 + 3:1 = 11:6. Pour realiser cette inference, il faut non seulement utiliser des informations quantitatives, mais egalement se servir de ces informations quantitatives pour deduire des informations qualitatives.

Les limitations de l'algorithme nous ont conduits a en de nir un a m^eme d'integrer les connaissances provenant des relations qualitatives et quantitatives. Pour ce faire, nous nous sommes inspires de techniques de raisonnement temporel, dont le formalisme se rap-proche de celui des cartes genomiques. Apres une presentation de ces techniques (chapitre 6), nous detaillerons le fonctionnement de l'algorithme global de construction de cartes (chapitre 7).

Chapitre 6

Representation et raisonnement