• Aucun résultat trouvé

Procédure

Dans le document Guide du système HiSeq MD 3000 (Page 45-73)

1 Dans l’écran de bienvenue, sélectionnezWash | Water(Lavage | Eau).

2 SélectionnezYes(Oui) pour laver des positions de réactifs appariés. Sinon, sélectionnez No(Non) pour laver des positions de réactifs SBS uniquement. SélectionnezNext (Suivant) pour continuer.

3 Chargez l’instrument avec de l’eau de laboratoire, comme suit : a Remplissez huit flacons SBS avec 250 ml d’eau de laboratoire.

b Remplissez dix tubes PE avec 12 ml d’eau de laboratoire.

4 Assurez-vous qu’une Flow Cell utilisée est chargée. Si nécessaire, chargez une Flow Cell utilisée. SélectionnezNext(Suivant).

5 Effectuez une vérification de la fluidique :

a Sélectionnez la solution 2 dans la liste déroulante. Acceptez les valeurs de pompe par défaut.

b SélectionnezPump(Pompe).

c Inspectez la Flow Cell à la recherche de bulles dans les voies et de fuites à proximité des collecteurs.

6 Retirez le tube d’évacuation du conteneur à déchets. N’insérez pas les tubes de la pompe de condensation.

7 Groupez les huit tubes d’évacuation à l’aide d’un parafilm en veillant à ce que toutes les extrémités soient au même niveau. Placez les extrémités des tubes groupés dans un flacon de 250 ml.

8 SélectionnezNext(Suivant) pour lancer le lavage à l’eau.

Positions Durée

approximative de l’analyse

8 positions SBS 20 minutes

8 positions SBS et 10 positions appariées 60 minutes

P ro c é d u re s a p rè s a n a ly s e

9 Une fois le lavage effectué, mesurez le volume distribué et enregistrez-le sur le formulaire de suivi de laboratoire.

Positions Volume total

distribué

Volule distribué par rainure

8 positions SBS 32 ml 4 ml

8 positions SBS et 10 positions appariées 72 ml 9 ml 10 Détachez les tubes d’évacuation et retournez-les vers le flacon à déchets.

E ffe c tu e r u n fo rm a ta g e ra p id e d u le c te u r d e s o rt ie

Guide du système HiSeq 3000

43

Effectuer un formatage rapide du lecteur de sortie

Pour libérer de l’espace disque sur l’ordinateur de l’instrument pour une analyse ultérieure, Illumina recommande un formatage rapide du lecteur de sortie (O:\) après l’achèvement d’une analyse. Le formatage rapide nettoie le lecteur O:\ sans supprimer de fichiers système ou de fichiers de maintenance de l’instrument importants.

REMARQUE

Les journaux de maintenance de l’instrument sont enregistrés sur le lecteur C:\. C’est pourquoi il n’est pas risqué de procéder à un formatage rapide du lecteur O:\ pendant un lavage de l’instrument.

1 Dans Windows, ouvrez Computer (Ordinateur) pour afficher la liste des lecteurs de l’ordinateur.

2 Faites un clic droit sur le lecteur O:\ et sélectionnezFormat(Formater).

3 Dans la boîte de dialogue Format (Formater), cochez la caseQuick Format(Formatage rapide).

4 SélectionnezStart(Démarrer).

P ro c é d u re s a p rè s a n a ly s e Inactivité de l’instrument

Respectez les instructions suivantes pour préparer l’instrument à une période d’inactivité pouvant aller jusqu’à dix jours. Pour des périodes de plus de dix jours, consultez la section Arrêter l’instrumentà la page 45.

1 Effectuez un lavage de maintenance complet pour bien rincer le système. Pour en savoir plus, consultez la sectionRéaliser un lavage de maintenanceà la page 38.

2 Laissez la Flow Cell sur la platine de Flow Cell avec le levier de Flow Cell en position 2. Cela maintient les collecteurs en position relevée.

3 Chargez 10 ml d’eau de laboratoire dans chacune des positions des réactifs dans les supports de réactifs. Puis abaissez les dispositifs d’aspiration.

4 N’éteignez pas l’instrument.

5 Avant d’utiliser à nouveau l’instrument, effectuez un lavage à l’eau. Pour en savoir plus, consultez la sectionRéaliser un lavage à l’eauà la page 41.

A rr ê te r l’i n s tr u m e n t

Guide du système HiSeq 3000

45

Arrêter l’instrument

Arrêtez le système seulement si vous n’envisagez pas de l’utiliser dans les dix prochains jours ou plus. Si vous envisagez d’utiliser l’instrument dans les dix prochains jours, consultez la sectionInactivité de l’instrumentà la page 44.

Utilisez la procédure suivante pour préparer la fluidique et arrêter le système en toute sécurité.

1 Procédez à un lavage de maintenance pour rincer le système. Pour en savoir plus, consultez la sectionRéaliser un lavage de maintenanceà la page 38.

2 Retirez la Flow Cell de la platine de Flow Cell.

3 À l’aide d’une lingette alcoolisée ou d’un tissu non pelucheux imprégné d’éthanol ou d’isopropanol, essuyez soigneusement la surface du portoir de Flow Cell jusqu’à ce qu’elle soit propre.

ATTENTION

Veillez à ce que l’alcool ne s’écoule pas dans les trous de décompression ou autour des collecteurs. Utilisez si besoin un chiffon de laboratoire peu pelucheux pour sécher la platine.

4 Chargez 10 ml d’eau de laboratoire dans chacune des positions des réactifs dans les supports de réactifs. Puis, abaissez les dispositifs d’aspiration.

5 Mettez l’instrument hors tension.

6 Pour redémarrer l’instrument, chargez de l’eau dans toutes les positions de réactifs, mettez l’instrument sous tension et effectuez un lavage à l’eau. Pour plus de renseignements, consultez la sectionRéaliser un lavage à l’eauà la page 41.

C h a p itr e 4

Guide du système HiSeq 3000

47

  Chapitre 4  Real-Time Analysis

Real-Time Analysis

Introduction 48

Présentation de RTA v2 49

Flux de travail de l’analyse temps réel 51

Fichiers de sortie de séquençage 55

Numérotation des plaques 56

R e a l- T im e A n a ly s is Introduction

Le logiciel Real-Time Analysis effectue une analyse des images et une définition des bases sur l’instrument au cours de l’analyse de séquençage, ce qui économise un temps précieux lors de l’analyse ultérieure des données. Le système HiSeq 3000 utilise une nouvelle version du logiciel Real-Time Analysis (RTA) appelée RTA v2, qui comprend les différences importantes d’architecture et de fonctionnalités suivantes :

} Les fichiers de configuration, les formats de fichier de sortie et le flux de travail du traitement diffèrent de ceux des précédentes versions du logiciel.

} Les paramètres du fichier de configuration utilisés avec les précédentes versions du logiciel ne sont pas compatibles avec RTA v2.

} Si RTA v2 est arrêtée, elle ne reprend pas le traitement et les données de l’analyse ne sont pas enregistrées.

} Les performances de démultiplexage ne sont pas calculées. L’onglet Index de

Sequencing Analysis Viewer (Visualiseur d’analyse de séquençage SAV) n’est donc pas rempli.

P ré s e n ta tio n d e R T A  v 2

Guide du système HiSeq 3000

49

Présentation de RTA v2

RTA v2 fonctionne sur l’ordinateur de l’instrument et extrait les intensités des images, effectue la définition des bases et lui attribue un score de qualité.

Contrairement aux versions précédentes du logiciel Real-Time Analysis, RTA v2 et le logiciel de commande communiquent par une interface Web HTTP et des fichiers de mémoire partagés.

Si RTA v2 est arrêtée, RTA v2 ne reprend pas le traitement et les données de l’analyse ne sont pas enregistrées. Une analyse ne peut donc pas reprendre après avoir été arrêtée.

RTA v2 reprend automatiquement seulement si une analyse est interrompue.

Si la connexion réseau est interrompue, RTA v2 continue le traitement et écrit les données sur le disque local. Le transfert des données reprend une fois la connexion rétablie.

Entrée de RTA v2

RTA v2 nécessite les fichiers d’entrée suivants :

} Les images des plaques contenues dans la mémoire locale du système.

} RunInfo.xml, que le logiciel de commande génère automatiquement au début de chaque analyse. À partir de ce fichier, RTA v2 lit le nom de l’analyse, le nombre de cycles, vérifie si une lecture est indexée et lit le nombre de plaques sur la Flow Cell.

} RTA.exe.config, qui est un fichier de configuration logicielle au format XML.

Sortie RTA v2

Les images de chaque canal passent de la mémoire à RTA v2 sous forme de plaques. À partir de ces images, RTA v2 produit des fichiers de sortie primaires qui prennent la forme d’un ensemble de fichiers de définition de bases dont la qualité est notée et de fichiers de filtrage. D’autres fichiers prennent en charge la génération des fichiers de sortie primaires.

} Fichiers de définition des bases : pour chaque plaque analysée, un fichier de définition des bases compressé (*.bcl) est généré pour chaque plaque par cycle. Le fichier de définition des bases contient la définition des bases et le score de qualité qui lui est associé.

} Fichiers de filtrage : chaque plaque génère des renseignements sur le filtre inclus dans un fichier de filtrage (*.filter) pour chaque plaque au cours de la totalité de l’analyse.

Le fichier de filtrage précise si les amplifiats ont franchi les filtres.

} Fichiers d’emplacement des amplifiats : un fichier d’emplacement des amplifiats (s.locs) contient les coordonnées X et Y de chaque amplifiat sur la Flow Cell.

Les fichiers de sortie primaires sont utilisés pour une analyse ultérieure des données.

Utilisez le logiciel de conversion bcl2fastq pour le démultiplexage et la conversion FASTQ.

Pour convertir des données à partir du système HiSeq 3000, utilisez bcl2fastq v2.16 ou une version supérieure. Pour obtenir la version actuelle du logiciel et télécharger des

renseignements, consultez la page d’assistance du système HiSeq 3000 sur le site Web d’Illumina.

RTA v2 fournit des indicateurs en temps réel sur la qualité de l’analyse, stockés dans des fichiers InterOp. Les fichiers InterOp sont des fichiers binaires contenant des indicateurs relatifs aux plaques, aux cycles et au niveau de lecture nécessaires pour afficher des indicateurs dans le visualiseur d’analyse de séquençage. Pour afficher les indicateurs générés par RTA v2, utilisez la version 1.8.46 du logiciel SAV ou une version supérieure.

Pour plus de renseignements, consultez la sectionFichiers de sortie de séquençageà la page 55.

R e a l- T im e A n a ly s is

Gestion des erreurs de RTA v2

RTA v2 crée des fichiers journaux dans le dossier RTALogs. Si une erreur se produit, elle est enregistrée dans un fichier d’erreur distinct au format de fichier *.tsv. Tous les fichiers journaux sont transférés vers la destination de sortie finale à la fin du traitement.

Les fichiers journaux suivants sont générés lorsqu’une erreur se produit.

} *GlobalLog*.tsv récapitule les événements importants survenus pendant l’analyse.

} *LaneNLog*.tsv enregistre les événements relatifs au traitement de chaque rainure.

} *Error*.tsv répertorie toutes les erreurs survenues au cours d’une analyse.

} *WarningLog*.tsv répertorie les avertissements reçus au cours d’une analyse.

Transfert de données

Au cous de l’analyse, RTA v2 demande le transfert des données auprès de

RunCopyService, le logiciel chargé de gérer le transfert vers l’emplacement spécifié du répertoire de sortie. En cas d’utilisatio de BaseSpace, le BaseSpace Broker gère le transfert des données vers BaseSpace. Si la connexion réseau est interrompue, RTA v2 continue le traitement et écrit les données sur le disque local. Le transfert des données reprend une fois la connexion rétablie.

REMARQUE

Assurez-vous que votre connexion réseau correspond à la connexion réseau minimale requise pour le transfert des données de l’analyse vers BaseSpace. Pour obtenir plus de renseignements, consultez le guide de configuration du laboratoire et de préparation du site de votre configuration HiSeq. Consultez la sectionRessources supplémentairesà la page 13.

Une fois l’analyse terminée, RTA v2 crée un fichier marqueur nommé RTAComplete.txt.

Le transfert des données est terminé une fois ce fichier créé.

F lu x d e tr a v a il d e l’a n a ly s e te m p s ré e l

Guide du système HiSeq 3000

51

Flux de travail de l’analyse temps réel

Le flux de travail de Real-Time Analysis comprend les étapes suivantes:

} Génération des modèles : établit les emplacements des amplifiats.

} Enregistrement et extraction d’intensité : enregistre l’emplacement de chaque amplifiat sur la Flow Cell modélisée et détermine une valeur d’intensité pour chaque amplifiat.

} Correction de la matrice de couleurs : corrige les interférences entre les canaux.

} Correction empirique de la mise en phase : corrige les effets de la mise en phase et de la mise en préphase.

} Définition des bases : détermine une définition des bases pour chaque amplifiat.

} Notation de la qualité : attribue un score de qualité à chaque définition des bases.

Génération du modèle

La première étape du flux de travail est la génération du modèle, qui définit la position de chaque amplifiat dans une plaque à l’aide des coordonnées X et Y. Le modèle est utilisé comme référence pour l’étape suivante d’enregistrement et d’extraction de l’intensité.

En raison de l’assemblage sur la Flow Cell modélisée, les positions des amplifiats sont prédéterminées en fonction du nombre de rangées, du nombre de colonnes et de la distance entre les nano-puits sur la Flow Cell. Pour obtenir plus de renseignements, reportez-vous à la sectionFlow Cell modéliséeà la page 5.

La position des amplifiats de la totalité de l’analyse s’inscrivent dans un même fichier d’emplacement des amplifiats (s.locs). Pour plus de renseignements, consultez la section Fichiers de sortie de séquençageà la page 55.

Enregistrement et extraction d’intensité

L’enregistrement et l’extraction de l’intensité commencent une fois que le modèle de positions d’amplifiats est généré.

} L’enregistrement transforme les modèles d’emplacement des amplifiats en l’emplacement sur l’image pour chacun des quatre canaux de couleur.

} L’extraction d’intensité détermine une valeur d’intensité pour chaque amplifiat du modèle pour une image donnée.

S’il y a échec d’enregistrement de l’image d’un cycle, quelle qu’elle soit, aucune définition des bases ne sera générée pour cette plaque dans ce cycle. Utilisez

Sequencing Analysis Viewer pour examiner les miniatures et trouver les images dont l’enregistrement a échoué. Pour plus de renseignements, consultez la sectionFichiers de sortie de séquençageà la page 55.

Correction de la matrice de couleurs

Après l’enregistrement et l’extraction de l’intensité, RTA v2 corrige les interférences entre les canaux. Les interférences se produisent lorsqu’un amplifiat possède une intensité dans le canal C et une intensité dans le canal A, par exemple. À l’aide d’une matrice de couleurs 4 × 4, RTA v2 génère des intensités corrigées par la matrice exemptes

d’interférences ou avec des interférences réduites, et équilibre les différences d’intensité générale entre les canaux de couleur.

R e a l- T im e A n a ly s is

Correction de la mise en phase empirique

Lors de la réaction de séquençage, chaque brin d’ADN dans un amplifiat s’étend d’une base par cycle. La mise en phase et la mise en préphase ont lieu lorsqu’un brin se retrouve hors phase par rapport au cycle d’incorporation en cours.

} La mise en phase se produit lorsqu’un brin a un retard d'une base.

} La mise en préphase se produit lorsqu’un brin a une avance d'une base.

Figure 25 Mise en phase et en préphase

A Lecture avec une base présentant une mise en phase B Lecture avec une base présentant une mise en préphase

RTA v2 corrige les effets de la mise en phase et de la mise en préphase à l’aide de l’algorithme de correction empirique de la mise en phase, qui exploite au maximum la qualité des données à chaque cycle tout au long de l’analyse.

Les résultats de la mise en phase et en préphase sont enregistrés dans un fichier nommé EmpiricalPhasing_[lane]_[read]_[tile].txt (Miseenphaseempirique_[ligne]_[lecture]_

[plaque].txt) situé dans le dossierData\Intensities\BaseCalls\Phasing.

Définition de bases

Une fois la couleur des intensités brutes corrigée, ainsi que la mise en phase et la mise en préphase, le canal de couleur dont l’intensité est la plus brillante correspond à la définition de base pour cet amplifiat dans ce cycle. La définition des bases sur le système HiSeq 3000 à l’aide de RTA v2 commence après le cycle 3.

La définition des bases détermine une base (A, C, G ou T) pour chaque amplifiat d’une plaque donnée d’un cycle spécifique. Les définitions des bases sont enregistrées dans des fichiers de définition des bases (*.bcl). Il s’agit de fichiers binaires comportant un octet par définition et par score de qualité. Chaque fichier de définition des bases contient la

définition de bases et le score de qualité qui lui est associé. Pour réaliser une définition des bases, les amplifiats doivent d’abord passer par le filtre de pureté. Les amplifiats qui ne passent pas le filtre ou qui ne peuvent pas être définis car ils sont en dehors de l’image ou parce que l’enregistrement de l’image a échoué sont des «  no-calls » (sans définition). Les

« no-calls » sont représentés comme (N).

Amplifiats passant par le filtre

Pendant les 25 premiers cycles de la lecture 1, le filtre de pureté supprime les amplifiats de basse qualité des résultats d’analyse. Les amplifiats passent le filtre s’il n’existe pas plus d’une définition des bases présentant une valeur de pureté inférieure à 0,6 dans les 25 premiers cycles. La pureté est définie comme le rapport de l’intensité de base la plus brillante divisée par la somme de l’intensité de base la plus brillante et de la deuxième

F lu x d e tr a v a il d e l’a n a ly s e te m p s ré e l

Guide du système HiSeq 3000

53

plus brillante. Le pourcentage d’amplifiats passant par le filtre est représenté dans les rapports d’analyse sous la forme %PF.

La Flow Cell modélisée HiSeq 3000 génère un pourcentage d’amplifiats passant par le filtre inférieur aux autres modèles HiSeq. Cette différence est due aux caractéristiques d’un assemblage ordonné d’amplifiats sur une Flow Cell modélisée par rapport à un assemblage aléatoire d’amplifiats sur une Flow Cell non modélisée.

} Amplifiats aléatoires sur une Flow Cell non modélisée : les amplifiats sont formés en un assemblage aléatoire et localisés pendant la génération du modèle. Les amplifiats de faible qualité sont supprimés du décompte d’amplifiats bruts pendant la génération du modèle, ce qui entraîne un pourcentage relativement élevé d’amplifiats passant par le filtre.

} Assemblage d’amplifiats ordonné sur une Flow Cell modélisée : les amplifiats sont formés dans un assemblage prédéfini de nano-puits. Les puits vides ne contenant pas d’amplifiat et les puits polyclonaux, où plus d’une séquence est présente, sont inclus dans le décompte d’amplifiats bruts, mais ne passent pas le filtre. L’assemblage ordonné sur une Flow Cell modélisée produit donc un pourcentage relativement faible d’amplifiats passant par le filtre.

Figure 26 Puits vides et polyclonaux (compris dans le comptage d’amplifiats bruts)

Figure 27 Puits contenant des amplifiats autres que PF (indiqués en gris)

Notation de la qualité

Un score de qualité ou Q-score est une prévision de la probabilité d’une définition de base erronée. Un score de qualité plus élevé implique qu’une définition des bases est d’une meilleure qualité et plus susceptible d’être correcte.

Le score de qualité constitue un moyen simple pour communiquer la probabilité de petites erreurs. Les scores de qualités sont représentés sous la forme Q(X), où X est le score. Le tableau suivant montre la relation entre le score de qualité et la probabilité d’une erreur.

Score de qualité Q(X) Probabilité d’une erreur

Q40 0,0001 (1 sur 10 000)

Q30 0,001 (1 sur 1 000)

Q20 0,01 (1 sur 100)

Q10 0,1 (1 sur 10)

R e a l- T im e A n a ly s is

REMARQUE

La notation de la qualité s’appuie sur une version modifiée de l’algorithme Phred. Pour obtenir plus de renseignements, consultez en.wikipedia.org/wiki/Phred_quality_score.

La notation de la qualité calcule un ensemble d’indicateurs prévisionnels pour chaque définition de bases, puis utilise ces valeurs pour rechercher un score de qualité dans un tableau de qualité. Les tableaux de qualité servent à fournir des indicateurs de qualité extrêmement précis pour des analyses générées par une configuration spécifique de plateforme de séquençage et de version de chimie.

Une fois le score de qualité établi, les résultats sont enregistrés dans des fichiers de définition de bases (*.bcl). Pour plus de renseignements, consultez la sectionFichiers de sortie de séquençageà la page 55.

Compartimentage par score de qualité

RTA v2 regroupe les scores de qualité selon des plages ou compartiments spécifiques et attribue une valeur à chaque plage. Le compartimentage par score de qualité réduit considérablement les besoins d’espace de stockage, sans affecter la précision ou le fonctionnement des applications en aval.

Le compartimentage par score de qualité contribue à l’efficacité du traitement des analyses et du transfert de données associés au débit élevé du système HiSeq 3000. Le fichier *.bcl qui en résulte est plus petit en raison des algorithmes de compression, qui parviennent à mieux compresser le fichier. La quantité de données écrites sur l’ordinateur de l’instrument est réduite. Les données sont transférées à un emplacement réseau, ce qui permet de copier le fichier plus vite.

F ic h ie rs d e s o rt ie d e s é q u e n ç a g e

Guide du système HiSeq 3000

55

Fichiers de sortie de séquençage

Type de fichier Description, emplacement et nom du fichier Fichier de définition des

bases

Chaque plaque analysée est incluse dans un fichier de définition des bases qui comprend la définition des bases et son score de qualité encodé.

Data\Intensities\BaseCalls\L00[X] : pour chaque rainure, les fichiers sont enregistrés dans des dossiers par cycle.

s_[Lane]_[Tile].bcl.gz(s_[Rainure]_[Plaque].bcl.gz), où « Rainure » représente le numéro à un chiffre de la rainure et « Plaque » représente le numéro à quatre chiffres de la plaque. Les fichiers de définition de base sont compressés selon la méthode gzip.

Fichier d’emplacement des amplifiats

Pour chaque plaque, un fichier d’emplacement des amplifiats contient les coordonnées XY de chaque amplifiat. Les fichiers d’emplacement des amplifiats sont le résultat de la génération du modèle.

Data\Intensities(Données\Intensités) : un fichier correspondant à l’analyse est enregistré dans le dossier Intensities (Intensités).

s.locs

Fichier de filtrage Le fichier de filtrage spécifie si un amplifiat a franchi les filtres. Les fichiers de filtrage sont générés au cycle 26 et portent sur 25 cycles de données.

Data\Intensities\BaseCalls\L00[X]

(Données\Intensités\DéfinitionsDesBases\L00[X]) : les fichiers sont enregistrés dans un dossier pour chaque rainure et chaque plaque.

s_[rainure]_[plaque].filter

Fichiers InterOp Les fichiers de rapport binaires sont utilisés pour

Sequencing Analysis Viewer. Les fichiers InterOp sont mis à jour tout au long de l’analyse.

DossierInterOp Fichier de configuration

Real-Time Analysis

Créé au début de l’analyse, le fichier de configuration de Real-Time Analysis indique les paramètres de l’analyse.

[Root folder] ([Dossier racine]) RTAConfiguration.xml Fichier de

renseignements sur l’analyse

Indique le nom de l’analyse, le nombre de cycles à chaque lecture, si la lecture est une lecture indexée et le nombre de témoins et de plaques sur la Flow Cell. Le fichier de renseignements sur l’analyse est créé au début de l’analyse.

[Root folder] ([Dossier racine]) RunInfo.xml

Fichiers des miniatures Une image miniature pour chaque canal et plaque dans chaque témoin à chaque cycle pendant l’imagerie.

Thumbnail_Images\L00[X]\C[X.1](Miniatures_Images\L00[X]\C [X.1]) : les fichiers sont enregistrés dans un dossier pour chaque rainure et dans un sous dossier pour chaque cycle.

s_[lane]_[tile]_[channel].jpg(s_[rainure]_[plaque]_[canal].jpg) : la plaque est représentée par un nombre à quatre chiffres qui indique la surface, le témoin et la plaque. Consultez la sectionNumérotation des plaquesà la page 56.

Dans le document Guide du système HiSeq MD 3000 (Page 45-73)

Documents relatifs