• Aucun résultat trouvé

Intégration de données hétérogènes Approches

N/A
N/A
Protected

Academic year: 2022

Partager "Intégration de données hétérogènes Approches"

Copied!
19
0
0

Texte intégral

(1)

Intégration de données hétérogènes Approches

Master 2

Bioinformatique et Biologie des Systèmes

(2)

Introduction

• Pourquoi ?

• Qu’est-ce que l’intégration ?

Interconnexion

Fusion

Médiation

Modélisation

Confrontation

Recoupement

(3)

Biologie, mesures, données et connaissances

GAT AC A TCT ATGTG

AGA CTA

Noyau

Cytoplasme

gène

transcription

traduction ARNm

chromosome

ADN

protéine complexe

protéique génome

transcriptome

protéome interactome

Cellule eucaryote

gaattcggccattcacatagc ctctacctccccctgccagtc ggctgggacaactcgggcaaa cccagctgagcttgagcg...

MTGLAEEWWFDSGRAALGAD ARDWKKFTQALESRFTPSTY AMNMEEDWSNLQCGPNESSY SYETRFRAARHHLSREA...

(4)

Intégration : vers une vue unifiée

• Exploitation des références (croisées)

interconnexion

schéma unifié matérialisé : entrepôt

schéma unifié virtuel : médiateur

• Modélisation

• Statistiques

• Confrontation visuelle, exploratoire

• Exploitation de la notion de voisinage

exploration

recoupement

confrontation

fusion

(5)

Intégration par interconnexion : principe

données d’expression familles de protéines

gènes protéines

interaction

protéine - protéine

voies métaboliques domaines protéiques

littérature

SRS [Etzold et al., 1996], Entrez [Schuler et al., 1996], …

(6)

Intégration par fusion ou par médiateurs

RelationnelSGBD Fichiers

plats SGBD

. . . . OO

Médiateur

Integr8 [Kersey et al., 2005], BioMart [Kasprzyk et al., 2004], WInGS [Abergel et al., 2004], BioKleisli [Davidson et al., 1997], …

Schéma unique entrepôt

donnéesde

(7)

Intégration : vers une vue unifiée

• Exploitation des références (croisées)

interconnexion

schéma unifié matérialisé : entrepôt

schéma unifié virtuel : médiateur

• Modélisation

• Statistiques

• Confrontation visuelle, exploratoire

• Exploitation de la notion de voisinage

exploration

recoupement

confrontation

fusion

(8)

Intégration par la modélisation : vers la cellule virtuelle

Modèle

• système de réactions

• interactions moléculaires

• pi calcul

Caractérisation et simulations

• validation

• prédictions

• propriétés émergentes Données sur

le métabolisme Réactions et

vitesses Données d’interaction Localisation cellulaire Composants

cellulaires Littérature

Virtual Cell [Loew et Schaff, 2001], E-CELL [Tomita et al., 1999], Cellerator [Shapiro et al., 2003],

MetExplore [Cottret et al., 2010], …

(9)

Intégration : vers une vue unifiée

• Exploitation des références (croisées)

interconnexion

schéma unifié matérialisé : entrepôt

schéma unifié virtuel : médiateur

• Modélisation

• Statistiques

• Confrontation visuelle, exploratoire

• Exploitation de la notion de voisinage

exploration

recoupement

confrontation

fusion

(10)

Statistiques

Analyse de la variance

Analyse en composantes principales

Analyse factorielle des correspondances

Analyse des correspondances multiples

nes

attributs

integrOmics devenu

MixOmics [Lê Cao et al., 2009]

(11)

Intégration : vers une vue unifiée

• Exploitation des références (croisées)

interconnexion

schéma unifié matérialisé : entrepôt

schéma unifié virtuel : médiateur

• Modélisation

• Statistiques

• Confrontation visuelle, exploratoire

• Exploitation de la notion de voisinage

exploration

recoupement

confrontation

fusion

(12)

Confrontation visuelle

Visant [Hu et al., 2005]

(13)

Intégration : vers une vue unifiée

• Exploitation des références (croisées)

interconnexion

schéma unifié matérialisé : entrepôt

schéma unifié virutel : médiateur

• Modélisation

• Statistiques

• Confrontation visuelle, exploratoire

• Exploitation de la notion de voisinage

exploration

recoupement

confrontation

fusion

(14)

Exploration visuelle de voisinages

S’intéresser aux relations entre objets plutôt que les objets isolés [Danchin, 1998]

Système Indigo [Nitschké et al., 1998]

(15)

Recoupement de voisinages : approche basée sur les graphes

[Boyer et al., 2005]

Composantes connexes communes

(16)

Recoupement de voisinages : approche ensembliste

complexes protéiques voies

métaboliques

Gene Ontology co-citation

localisation chromosomique

domaines protéiques ensembles de gènes

(17)

Fusion : approche basée sur les graphes

STRINGdb [von Mering et al., 2003]

(18)

Approche apprentissage automatique / fusion : dimensions & dissimilarités. Priorisation et clustering

gènes connus

gènes candidats

séquences domaines

régulation annotations interactions expression

dimensions

quences

gulation

expression domaines

annotations interactions

fusion

[Aerts et al., 2006]

(19)

Vue générale

Intégration

etReprésentation

Recoupement etConfrontation

Combinaison

Exploration et recoupement de voisinages

Analyse

Modélisation des systèmes composant un organisme

Entrepôt de données ou approches par médiateurs

Interconnexion par références croisées

Traitements statistiques Confrontation

visuelle

Références

Documents relatifs

Large regions tend to have smaller p-values while small regions tend to have higher percentage of enrichment. → A smaller region included in a more significant one is pertinent if

Les travaux de Russell et al. [4] considèrent la mise en relation de peintures repré- sentant des sites architecturaux avec des modèles réels de ces sites. Les auteurs présentent

En effet, celui-ci ayant une superficie plus grande que celle des trous entre planches, nous pouvons trier la sélection de la requête spatiale avec l’expression

Dans cet article nous présentons donc une approche à base de graphe pour délimiter les zones fonctionnelles en utilisant à la fois des données de mobilité et des points

performed on 395 medicolegal autopsy cases, heat stroke fatalities displayed increased postmortem serum creatinine levels along with normal urea nitrogen concentrations, which

Pour la tâche 1 qui est la plus simple vu la faible hétérogénéité, sa structure plate, le faible écart entre les éléments des schémas, nous avons constaté que tous les

Ainsi, la détection d’anomalies dans ce flux d’arêtes peut être vue comme un problème de comparaison/classification de graphes : au fur et à mesure que les graphes évoluent

Dans nos travaux de recherche, nous contribuons à la résolution de la problématique d‟intégration et d‟interopérabilité des systèmes d‟information, notamment