• Aucun résultat trouvé

Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL

N/A
N/A
Protected

Academic year: 2021

Partager "Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL"

Copied!
31
0
0

Texte intégral

(1)

HAL Id: hal-01455928

https://hal.archives-ouvertes.fr/hal-01455928

Submitted on 5 Jun 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL

Frédéric Herault, Jérémy Yon, Florian Herry, Sophie Allais, Pascale Le Roy

To cite this version:

Frédéric Herault, Jérémy Yon, Florian Herry, Sophie Allais, Pascale Le Roy. Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL. Réunion du projet Selgen INCoMINGS, Oct 2016, La Rochelle, France. �hal-01455928�

(2)

Séminaire INCoMINGS La Rochelle 10-11 octobre 2016 Hérault et al. / Selection de SNP pour l’Imputation: SS4I

Select_SNP_4_Imputation (SS4I) :

Un outil simple de sélection de SNP en fonction du DL.

Frédéric Hérault, Jeremy Yon, Florian Herry, Sophie Allais, Pascale Le Roy

(3)

.02

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Select_SNP_4_Imputation (SS4I)

 Outil développé en Python

 Sélection d’un panel réduit de SNP:

• Puce basse densité

• Imputation

 Sélection basé sur le DL entre chaque paire de SNP au sein d'un chromosome.

Structure particulière du génome Gallus gallus.

(4)

.03

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Structure et DL du génome Gallus gallus

 39 paires de chromosomes.

• Macrochromosomes (GGA1 to GGA5)

• Chromosomes intermédiaires (GGA6 to GGA10)

• Microchromosomes (GGA11 to GGA 38)

• Sexual chromosomes (Z & W).

(5)

.04

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Structure et DL du génome Gallus gallus

Niveau et étendue du DL entre ≠ catégorie de chromosomes

(6)

.05

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Principe de fonctionnement

 Calcul du DL entre chaque paire SNP (PLINK).

 Clustering Hiérarchique Ascendant basé sur le DL.

 Création dendrogramme.

 Sélection d’ensemble de SNP répondant au critère de seuil de DL.

 Sélection d’un SNP représentatif de chaque ensemble.

Pour chaque chromosome

(7)

.06

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1

1 2 2 3 3 3 4 4 4 5 6 7

DG G

GG GD

D

DD

SNP

(8)

.07

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1

1 2 2 3 3 3 4 4 4 5 6 7

DG G

GG GD

D

DD

SNP

DL > Seuil ?

(9)

.08

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1

1 2 2 3 3 3 4 4 4 5 6 7

DG G

GG GD

D

DD

SNP

DL > Seuil ?

(10)

.09

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 3 4 4 4 5 6 7

DG G

GG GD

D

DD

SNP

(11)

.010

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 3 4 4 4 5 6 7

DG G

GG GD

D

DD

SNP

DL > Seuil ?

(12)

.011

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 4 4 5 6 7

DG G

GG GD

D

DD

SNP

(13)

.012

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 4 4 5 6 7

DG G

GG GD

D

DD

SNP

DL > Seuil ?

(14)

.013

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 4 4 5 6 7

DG G

GG GD

D

DD

SNP

(15)

.014

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 4 4 5 6 7

DG G

GG GD

D

DD

SNP

DL > Seuil ?

(16)

.015

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélections des ensembles de SNP / DL.

Racine

1 2 3 4

1 2

1 2 3 3 4 4 5 6 7

DG G

GG GD

D

DD

SNP

(17)

.016

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélection d’un SNP dans chaque ensemble.

 Au sein de chaque groupe:

• MAF du SNP : la plus forte

• Position du SNP / autres SNP du groupe.

(18)

.017

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélection d’un SNP dans chaque ensemble.

 Au sein de chaque groupe:

• MAF du SNP : la plus forte

• Position du SNP / autres SNP du groupe.

(19)

.018

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélection d’un SNP dans chaque ensemble.

 Au sein de chaque groupe:

• MAF du SNP : la plus forte

• Position du SNP / autres SNP du groupe.

SNP MAF +++

Position excentrée

(20)

.019

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Sélection d’un SNP dans chaque ensemble.

 Au sein de chaque groupe:

• MAF du SNP : la plus forte

• Position du SNP / autres SNP du groupe.

SNP MAF +++

Position excentrée

SNP MAF ++

Position représentative du groupe

(21)

.020

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « input »

 Trois fichiers sont nécessaires au fonctionnement du programme.

• Un fichier de génotypage au format PLINK «.ped»:

6 colonnes + génotype, 1 ligne par individu

Family ID, Individual ID, Paternal ID, Maternal ID, Sex, Phenotype & Genotype

(22)

.021

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « input »

 Trois fichiers sont nécessaires au fonctionnement du programme.

• Un fichier de génotypage au format PLINK «.ped»

• Un fichier de carte au format PLINK «.map»:

4 colonnes, 1 ligne par SNP

Chromosome, SNP identifier, Genetic distance, Base-pair position

(23)

.022

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « input »

 Trois fichiers sont nécessaires au fonctionnement du programme.

• Un fichier de génotypage au format PLINK «.ped»

• Un fichier de carte au format PLINK «.map»

• Un fichier paramètre.

(24)

.023

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « input »

(25)

.024

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « input »

Si SNP > 40 k SNP sur 1 chromosome => problème mémoire !

(26)

.025

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « output »

 Deux fichiers sont générés en sortie.

• Un fichier log:

 rappel des paramètres de l'analyse

 déroulement de l'analyse.

(27)

.026

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Fichier « output »

 Deux fichiers sont générés en sortie.

• Un fichier log

• Un fichier « Selected_SNP »

(28)

.027

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Résultats: Nombre SNP / Chromosome

 Optimisation du nombre de SNP sur les macrochromosomes

 Densification du nombre de SNP sur les microchromosomes

Florian Herry, mémoire de fin d’études Septembre 2016

(29)

.028

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Résultats: Répartition des SNPs.

(30)

.029

Hérault et al. / Selection de SNP pour l’Imputation: SS4I Séminaire INCoMINGS La Rochelle 10-11 octobre 2016

Exécution du programme:

 Exécution du programme: bigmem 40 GT

Select_SNP_4_Imputation.py Parameters.txt

 Analyse de 280 k SNPs sur 31 Chromosomes.

 Temps d’exécution: 20h.

(31)

Séminaire INCoMINGS La Rochelle 10-11 octobre 2016 Hérault et al. / Selection de SNP pour l’Imputation: SS4I

Merci de votre attention.

Références

Documents relatifs

Florian Herry, Frédéric Herault, Amandine Varenne, Thierry Burlot, Pascale Le Roy, Sophie Allais.. To cite

The evolution of mean correlations between true and imputed genotypes according to the number of SNPs on the low density SNP chips was studied on scenario (A), for both lines and

Dans la présente recherche, nous avons étudié l’impact de nos interventions de renfort pédagogique sur le concept de soi scolaire et le sentiment d’efficacité

Imputation from 5K to 50K (Scenarios 25–31) using the FIM- PUTE software under different scenarios and two types of reference population: (i) fixed reference population containing

A: hsphase; B: AlphaPhase with pedigree; C: pedigree free AlphaPhase; D: BEAGLE; E: PedPhase; red and blue colours indicate the sire ’s strands inherited by each offspring, obtained

Conclusion: This study, the first genome-wide SNP interaction analysis conducted so far on VT risk, suggests that common SNPs are unlikely exerting strong interactive effects on

Non seulement les parents incompatibles sont exclus mais les parents compatibles sont classés en fonction de leur vraisemblance, calculée à partir des probabilités de transmission

Si le niveau de polymorphisme est aussi élevé chez le canard et la caille que chez la poule (entre 4 et 5 SNP par kb, lors de la comparaison de 2 chromosomes seulement, selon