• Aucun résultat trouvé

Apprentissage de données fonctionnelles pour l’étude de l’association entre expression de gènes et signaux épigénomiques

N/A
N/A
Protected

Academic year: 2022

Partager "Apprentissage de données fonctionnelles pour l’étude de l’association entre expression de gènes et signaux épigénomiques"

Copied!
2
0
0

Texte intégral

(1)

AGROCAMPUS-OUEST

http://www.agrocampus Département de Statistique et

Informatique UMR 6625

Offre de thèse – Irmar – Equipe de statistique Sujet: Apprentissage de données

gènes et signaux épigénomiques

Mots-clés: Données fonctionnelles, multiples.

Contexte

Dans le contexte actuel de réchauffement écosystèmes et plus particulièrement d’importantes variations climatiques conséquences potentiellement néfastes épisodes dont la fréquence et la durée rapidement afin de mettre en place s’acclimater à moyen terme.

A des échelles de temps plus longues, une option pour générer de nouveaux extrêmes. En revanche, à des échelles mécanismes épigénétiques (changements post-traductionnelles des histones

modifier rapidement l’expression répondre à ces nouvelles contraintes organismes pathogènes sont capabl stress environnementaux pour s’y

résilience à plus long terme par l’établissement des données épigénomiques, issues

champignon filamenteux pathogène Notre premier objectif est d’explorer

(RNA-seq) et diverses marques épigénétiques afin de caractériser finement à l’échelle de cet organisme.

Les signaux obtenus par ces approches de l’association entre l’expression d’un compte de connaissances biologiques

OUEST 65 rue de Saint-Brieuc – CS 84215 – 35042 Rennes http://www.agrocampus-ouest.fr Tél. : +33(0)2 23 48 58 93

6625 CNRS

Offre de thèse

Apprentissage de données l’étude de l’association entre et signaux épigénomiques

statistique

fonctionnelles pour l’étude de l’association

fonctionnelles, Epigénétique, Grande dimension, M

réchauffement global, les organismes qui coexistent particulièrement les pathogènes et ravageurs des plantes

climatiques - et notamment l’accumulation d’épisodes néfastes sur leur physiologie et leur potentiel

durée sont difficiles à anticiper, les organismes place des phénotypes leur permettant de survivre longues, la création de variabilité génétique par

nouveaux génotypes et phénotypes plus adaptés échelles de temps plus courtes, il est très

(changements d’accessibilité de la chromatine, marques histones et méthylation de l’ADN) constituent un

des gènes et produire de nouveaux phénotypes ntraintes environnementales. Nous faisons donc capables de modifier rapidement leurs épigénome

acclimater rapidement, jusqu’à l’amélioration l’établissement d’une mémoire épigénétique.

issues de technologies de séquençage à haut pathogène du blé et producteur de mycotoxines (

d’explorer les relations à l’échelle du génome entre épigénétiques (distribution des nucléosomes,

l’échelle moléculaire l’état épigénomique et expressionnel approches sont par natures hétérogènes et complexes

d’un gène et les données épigénomiques s’y biologiques préalables mais aussi d’un modèle pour

Cedex

données fonctionnelles pour entre expression de gènes épigénomiques

l’association entre expression de

Machine learning, Tests

coexistent au sein des agro- plantes doivent faire face à d’épisodes caniculaires - avec des de nuisibilité. Face à ces organismes doivent répondre survivre à court-terme et de par recombinaison constitue adaptés à ces conditions très vraisemblable que des marques de modifications un moyen efficace pour phénotypes permettant de donc l’hypothèse que les pigénomes en réponse à des l’amélioration potentielle de leur Nous avons à disposition aut débit, obtenues sur un (Fusarium graminearum).

entre expression de gènes nucléosomes, méthylation de l’ADN) expressionnel du génome complexes à décrire. L’étude s’y rapportant doivent tenir pour données fonctionnelles

(2)

AGROCAMPUS-OUEST 65 rue de Saint-Brieuc – CS 84215 – 35042 Rennes Cedex http://www.agrocampus-ouest.fr Tél. : +33(0)2 23 48 58 93

rendant compte de la forte dépendance, à la fois entre les gènes dont les expressions sont mutuellement régulées (on parle de réseau) mais aussi au sein même des signaux épigénomiques (dépendance spatiale le long de la séquence de nucléotides). La grande dimension des données couplée à cette double structure de dépendance définit un nouveau paradigme pour élaborer des méthodes de tests multiples et de prédiction optimales. Un point de départ possible pour aborder cette problématique pourra s’inspirer de Friguet et al. (2009), Sheu et al. (2016), Causeur et al. (2019) et Hébert et al., (2021).

Causeur, D., Sheu, C.-F., Perthame, E. and Rufini, F. (2019). A functional generalized F-test for signal detection with applications to event-related potentials significance analysis. Biometrics. 2019; 1-11.

https://doi.org/10.1111/biom.13118

Friguet, C., Kloareg, M. and Causeur, D. (2009). A factor model approach to multiple testing under dependence. Journal of the American Statistical Association. 104 (488) 1406-1415.

Hébert, F., Causeur, D. and Emily, M. (2021). Flexible handling of dependence for SNP-set signal detection in Genome-Wide Association Studies. Computational Statistics and Data Analysis. 153.

https://doi.org/10.1016/j.csda.2020.107082.

Sheu, C-.F., Perthame, E., Lee, Y-.S., Causeur, D. (2016). Accounting for time dependence in large-scale multiple testing of event-related potential data. Annals of Applied Statistics. 10(1), 219-245.

Département de Statistique et Informatique

L’équipe de recherche en Statistique (7 membres) de l’institut Agro - Agrocampus Ouest (Rennes) est intégrée à l’équipe Statistique (environ 40 membres) de l’Institut de Recherche en Mathématique de Rennes (Irmar, UMR 6625 CNRS). La recherche en statistique à Agrocampus Ouest est particulièrement orientée vers l’apprentissage de données de grande dimension, l’analyse de données génomiques, écologiques et de signaux biophysiques.

Pour plus d’information, www.agrocampus-ouest.fr et www.irmar.univ-rennes1.fr Détails

Encadrement : David Causeur (Irmar, Rennes)

Co-encadrement : Nadia Ponts (UR MycSA, INRAE Bordeaux), Gaël le Trionnaire (UMR IGEPP, INRAE Rennes)

Lieu : Institut Agro - Agrocampus Ouest, 65 rue de St-Brieuc, CS84215, 35042 Rennes cedex Contact: David Causeur,

Email: david.causeur@agrocampus-ouest.fr

Url: http://math.agrocampus-ouest.fr/infoglueDeliverLive/membres/david.causeur

Références

Documents relatifs

Ce mandat fait précisément de nous, Européens, des citoyens du monde, et ses obligés, écrit Marie Cosnay en 2009 : « C’est en mon temps et en mon nom que des milliers

Une partie de ces lymphocytes B se différencie en plasmocytes, une autre en lymphocytes B mémoire: ce sont des cellules à durée de vie longue, plus nombreuses que les LB

A cet égard, pour la série étudiée, nous voudrions distinguer deux types de variables exogènes : la prise en compte de l'influence des aléas climatiques améliorerait certainement

Dans un troisième temps, nous avons essayé de généraliser notre méthode afin de profiter de notre expérience pour aborder des modèles de prévision sur des variables autres que

Au sens économique, l’entreprise ou la firme est une unité technique qui combine divers facteurs de production ou « inputs » (capital, travail,…etc.) afin de produire des biens

L'hypothèse d'indépendance des observations dans les GLM est très restrictive lorsqu'il s'agit de données longitudinales où les mesures répétées sur un même sujet

Hannan [10] a proposé d'utiliser les résultats de l'analyse spectrale pour l'estimation dans les modèles à retards échelonnés, en montrant que cette procédure est plus efficace

Cet article s'intéresse ici à trois types d'infrastructures aussi différents que les barrages, les ouvrages d'art routiers et les réseaux d'eau potable, et nous montre comment un