• Aucun résultat trouvé

Segmentation de signal et détection d'aberrations chromosomiques

N/A
N/A
Protected

Academic year: 2021

Partager "Segmentation de signal et détection d'aberrations chromosomiques"

Copied!
3
0
0

Texte intégral

(1)

HAL Id: inria-00386788

https://hal.inria.fr/inria-00386788

Submitted on 22 May 2009

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Segmentation de signal et détection d’aberrations chromosomiques

Stéphane Robin

To cite this version:

Stéphane Robin. Segmentation de signal et détection d’aberrations chromosomiques. 41èmes Journées

de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-00386788�

(2)

Segmentation de signal et d´ etection d’aberrations chromosomiques

St´ ephane Robin

AgroParisTech/INRA, UMR 518 Math. & Info. Appli.

16 rue C. Bernard 75005 Paris, France

1 Segmentation

Les probl` emes de segmentation se rencontrent dans l’analyse de nombreux signaux bi- ologiques, climatologiques, industriels, ´ economiques. Ces analyses combinent souvent des probl` emes algorithmiques dus ` a la taille de l’espace des segmentations possibles et des probl` emes statistiques comme le choix du nombre de segments.

De fa¸con g´ en´ eral, on s’int´ eresse ` a un signal {Y

t

}

1≤t≤n

, dont les mesures Y

t

sont ind´ ependantes et dont la loi change aux dates (dites de ruptures) τ

k

. En notant I

k

= ]τ

k−1

+ 1; τ

k

] :

Y

t

∼ F (θ

k

) pour t ∈ I

k

L’inf´ erence porte sur le nombre de segments K, les param` etres des distribution au sein de chaque segment {θ

k

}

1≤k≤K

et les positions des ruptures {τ

k

}

1≤k≤K

.

2 S´ election de mod` ele

L’estimation du nombre de segments K constitue un probl` eme de s´ election de mod` ele pour lequel les crit` eres usuels (AIC, BIC) ne peuvent g´ en´ eralement pas s’appliquer na¨ıvement

`

a cause de la taille et de la forme de l’espace des segmentations (union d’espaces vecto- riels, Zhang & Siegmund, 07) et cadre asymptotique particulier (le nombre de segmenta- tions possibles croit exponentiellement avec le nombre de mesures, Lebarbier, 05). Ces probl` emes peuvent ˆ etre contourn´ es en consid´ erant chaque segmentation possible. On peut alors d´ eriver des crit` eres de type BIC et ICL dont le calcul requi` erent une exploration exhaustive de cet espace, ce qui est algorithmiquement possible.

3 Segmentation multiple

Dans le domaine bio-m´ edical, il est souvent n´ ecessaire d’analyse simultan´ ement des sig- naux mesur´ es sur plusieurs patients pour distinguer les ruptures d’´ eventuels art´ efacts.

Les patients pr´ esentant chacun des aberrations propre, la segmentation simultan´ ee (i.e.

1

(3)

en supposant les ruptures communes ` a tous) n’a pas de sens. On pr´ esentera un mod` ele mixte permettant la segmentation conjointe de plusieurs profils chromosomiques, dans lequel l’effet al´ eatoire est sens´ e rendre compte d’art´ efacts technologiques. On pr´ esentera

´ egalement un algorithme de type E-M pour l’inf´ erence (Picard & al., 07).

4 Recherche d’aberrations r´ ecurrentes

L’analyse conjointe de plusieurs profils permet enfin de rechercher des ´ ev´ enements (aber- rations) r´ ecurrents parmi les patients atteints d’un mˆ eme type de cancer. Un profil chro- mosomique discret se pr´ esente comme une suite de −1 (perte), 0 (normal) et +1 (gain) dans lequel une aberration est d´ efinie comme une suite de (−1) ou de (+1).

La recherche d’aberrations r´ ecurrentes s’apparente alors ` a l’´ etude des occurrences si- multan´ ees d’un motif dans plusieurs s´ equences. On pr´ esentera des bornes pour les proba- bilit´ es critiques associ´ es ` a des ´ ev´ enements exceptionnels. Le calcul de ces borne est fond´ e sur des technique de chaˆıne de Markov “embarqu´ ees” (Embedded Markov chain, Robin

& Stefanov, 08).

Bibliographie

[1] Lebarbier, E. (2005). Detecting multiple change-points in the mean of gaussian process by model selection. Signal Processing. 85 717–736.

[2] Picard, F. , Lebarbier, E. , Budinska, E. and Robin, S. (2007), Joint segmen- tation of multivariate gaussian processes using mixed linear models. Research Report 5, INRA-Statistics for System Biology group.

genome.jouy.inra.fr/ssb/preprint/SSB-RR-5.mod mixed seg.pdf.

[3] Robin, S. and Stefanov, V. (2008). Simultaneous occurrences of runs in indepen- dent Markov chains. Method. Comput. Appl. Prob. ? DOI: 10.1007/s11009-008-9093-3, Tech. Report at genome.jouy.inra.fr/ssb/preprint/SSB-RR-11-sim-occ-run.pdf.

[4] Zhang, N. R. and Siegmund, D. O. (2007). A modified Bayes information criterion with applications to the analysis of comparative genomic hybridization data. 63 (1) 22–

32.

2

Références

Documents relatifs

nale d'un certain nombre de tumeurs d'un même type, on voit que même les anomalies les plus fréquentes peu­. vent survenir tardivement, dans

Dans les anomalies chromosomiques des néoplasies de type T, 1 'examen des chromosomes remaniés confirme que les points de cassure localisés dans les bandes

2.1.5.3 Non disjonctions mitotiques des gonosomes (cas d’une cellule XX) Une non disjonction des chromatides d’un ou des 2 chromosomes sexuels se produit au cours d’une division

Ici nous g´en´eralisons trois crit`eres de s´election de mod`eles, qui avaient ´et´e propos´es dans le cas de la segmentation d’une serie, `a la segmentation jointe de

Nous considérons un modèle de régression linéaire de grande dimension et plus pré- cisément le cas d’un modèle factoriel pour lequel le vecteur des variables explicatives

Pour le d´etecteur ISOPHOT C-100 embarqu´e sur le satellite ISO, nous avons montr´e qu’un mod`ele semi-empirique permet de d´ecrire avec une bonne pr´ecision (de l’ordre de

In the first step, we used the k-means clustering and Horn & Schunck algorithms in order to segment the image based on color space and optical flow extraction respectively

Outils: Transform´ee de Laplace, ´equation de Fokker-Planck, noyaux de Green, d´eveloppement en s´erie de fonctions propres, nouvelle repr´sentation int´egrale pour le module au