• Aucun résultat trouvé

Chapitre 2 : Présentation des méthodes biophysiques principales utilisées : La diffusion de rayons

1. La diffusion aux petits angles (SAS)

1.2. Interprétation des données

Équation 11

1.2.Interprétation des données

1.2.1. Poids moléculaire Mw

L'intensité diffusée à l’angle zéro (2θ = 0) notée I(0) est proportionnelle à la masse moléculaire

Mw et à la concentration c des particules en solution, à condition que les particules aient la même

densité de longueurs de diffusion (i.e. la composition chimique moyenne des particules est

identique)338.

L’intensité à q = 0 ne peut être mesurée directement, cette zone correspondant au faisceau direct

étant masquée par le dispositif d’arrêt de faisceau. I(0) doit par conséquent être extrapolée depuis

les données expérimentales grâce à l’approximation de Guinier (voir partie suivante). Si

l’échantillon est monodisperse et que la masse moléculaire Mw ou la concentration c est connu, le

paramètre inconnu Mw ou c peut être obtenu à partir duI(0)en utilisant l’équation 12333 :

I(0) ∝ Mwc

Équation 12

1.2.2. Rayon de giration Rg

En mécanique, le rayon de giration Rg représente la distance par rapport à l'axe de rotation d’un

corps à laquelle il faut placer un point de masse égale à celle du corps pour qu'il ait le même moment

d'inertie que celui-ci. Le Rg d’une molécule est donc un indicateur de sa taille et de sa compacité.

Lors de mesures SAS, le Rg décrit la distribution de la densité de diffusion (par rapport au tampon)

autour du centre de densité de diffusion de la molécule. Des objets de mêmes masses mais de

formes différentes ont des valeurs de Rg différentes. Par exemple, un objet sphérique a un rayon

de giration plus petit qu’un objet allongé ou que tout autre objet de même masse.

L’approximation de Guinier339permet d’obtenir une estimation des intensités I(q) aux très petits

angles, autrement dit pour qRg ≤ 1. La diffusion dépendra de la taille de la particule selon une loi

générale indépendante de sa forme et de sa symétrie333.

I(q) = I(0)exp (−q²Rg

2

3 )

Équation 13

En traçant ln (I(q))en fonction de q2,les données sont alors sous la forme d’une ligne droite avec

une pente de −Rg2/3dans la zone de validité de l’approximation de Guinier (qRg ≤ 1), et le rayon

de giration peut ainsi être déduit. Pour des protéines globulaires, cette relation est valable pour

66

qRg≤ 1,3 puisque la zone linéaire est généralement plus large326. En extrapolant la droite à

l’ordonnée, I(0) peut être déduit.

Si la solution est monodisperse, le rayon de giration obtenu avec l’équation 13 peut être associé à

la forme et à la taille (si la masse moléculaire est connue) de la particule en solution. Dans le cas

d’un système polydisperse, la valeur de Rgest influencée par l’ensemble des particules en solution

et sa valeur sera alors une moyenne.

Les valeurs q plus élevées contiennent des informations sur la forme moléculaire. Pour les

macromolécules repliées, l'intensité de la diffusion diminue selon la loi de Porod340 :

I(q) ∝ q−4

Équation 14

Une autre méthode pour déterminer Rg et I(0) consiste à utiliser la fonction de distribution de

distances entre les éléments de volume à l’intérieur de la particule, dite fonction de distribution des

distances par paires P(r)341. Cette fonction correspond à la probabilité des distances interatomiques

et utilise donc le profil de diffusion entier et non pas seulement les valeurs à faibleq. Il s’agit de la

transformée de Fourier inverse de la courbe des intensités de diffusion I(q)d’un échantillon :

P(r) = r

2

2π2 ∫ q2

0

I(q) eiq⃗⃗ r⃗ dq

Équation 15

Dans le cas de solutions monodisperses, il est décrit que :

I(q) = 4π ∫ P(r)sin (qr)

qr

Dmax

0

dr

Équation 16

I(0)est donc proportionnel à l’aire sous P(r) :

I(0) = 4π ∫ P(r)dr

Dmax

0

Équation 17

La limite maximale de l’intégrale est Dmax, qui représente la distance maximale entre deux points

dans une même particule.

L’équation 18 décrit comment Rg est relié à P(r). Pour l’appliquer, il est nécessaire d’avoir des

données avec des statistiques élevées et sans erreurs systématiques333 :

R2g= ∫ P(r) r

2dr

2 ∫ P(r) dr

67

1.2.3. Traitement des données et analyse standard en biologie

Les données brutes issues d’une mesure SAS sont réduites par une série de corrections qui

comprennent la normalisation de l'image par rapport à l'intensité du faisceau incident, l’étalonnage

de q, la correction pour la transmission de l'échantillon et la soustraction de l'arrière-plan, le

masquage des pixels indésirables, et l’étalonnage de l'intensité, suivies d'une intégration radiale.

La suite ATSAS342 contient plusieurs des programmes spécialement conçus pour analyser les

données SAXS et SANS des biomacromolécules en solution une fois les données réduites et

constitue la suite de programmes majoritairement utilisée dans le domaine. Les programmes

présentés ci-dessous font partie de la suite ATSAS.

Les intensités du tampon sont soustraites des intensités des échantillons respectifs en utilisant le

logiciel PRIMUS343 afin d’obtenir la courbe de diffusion SAS. Différentes informations peuvent

être obtenues selon la région de la courbe étudiée en utilisant ce même logiciel (voir figure 34) :

▪ Les rayons de giration Rg des échantillons sont extraits en utilisant l’approximation de

Guinier339 (équation 13). L’information du Rg peut être extraite des premiers points de la courbe

en calculant la pente d’une droite les alignant. La possibilité d’aligner une droite sur ces points

et de valider l’approximation de Guinier renseigne sur l’état de l’échantillon (agrégé ou non).

▪ Le contenu en flexibilité de l’échantillon peut être étudié par le tracé de la courbe de Kratky.

Les macromolécules globulaires suivent la loi de Porod (équation 14) et ont des courbes en

forme de cloche. Les molécules allongées, comme les protéines dépliées, n'ont pas ce pic et

sont en légère augmentation ou ont un plateau dans la gamme q plus large.

▪ L’analyse de la fonction P(r) (équation 18) renseigne sur la forme des protéines en solution.

Alors que cette courbe a une forme de cloche pour une protéine globulaire, elle présentera une

queue plus longue pour les protéines allongées et plusieurs pics pour une protéine

multi-domaine. La distance maximale Dmax de la protéine peut également être estimée à partir de

cette analyse des distances, représentant la distance extrapolée à P(r) = 0.

Il est courant d’analyser les données obtenues par SAS non pas en étudiant les résultats d’une seule

concentration mais en combinant une faible et une forte concentration. Une mesure SAS sur une

faible concentration apporte des informations précises aux petits angles, appelée la zone ou région

de Guinier, alors que les informations aux plus grands angles ne sont pas accessibles car les données

sont trop bruitées. En revanche, les mesures à forte concentration sont moins précises dans la

région de Guinier (risque d’agrégation ou de répulsion) mais plus résolutives et donc précises sur

le facteur de forme. Une courbe chimère peut être réalisée en fusionnant deux courbes sur une

région couvrant quelques dizaines à une centaine de points, juste après la région de Guinier.

68

Figure 34 : Courbes théoriques de diffusion et d'analyse SAS. Adapté de Putnam, C. D., et al. (2007)326.

Le programme CHROMIXS permet de tracer un ensemble de données SAXS, généré lors d’une

mesure SEC-SAXS ou SEC-SANS (chromatographie d’exclusion de taille en ligne SAXS ou

SANS), en fonction du temps d'élution. Cela permet de sélectionner des zones de tampon et

échantillons d’intérêt et d'établir une courbe SAS, qui sera ensuite traitée par le logiciel PRIMUS.

Pour la visualisation structurale ainsi que la validité des modèles, les programmes DAMMIF344 et

DAMMIN345 sont utilisés pour générer des modèles ab initio en billes en se basant sur la valeur de

Dmax calculée par le logiciel GNOM346.

Le programme OLIGOMER343 est utilisé pour déterminer les fractions volumiques de différentes

espèces d’un mélange de protéines. Les facteurs de forme de chaque espèce peuvent être générés

par ffmakeret utilisés par OLIGOMER pour le calcul des proportions.

Etant donné que l’intensité de diffusion observée pendant une expérience de SAS est la moyenne

sur toutes les orientations des transformées de Fourier des intensités de longueur de diffusion ρn,

ou des densités électroniques ρe des particules en solution, il est possible de calculer les courbes de

diffusion théorique si ρn(𝑟 ) ou ρe(𝑟 ) sont connus. Les programmes CRYSOL347 et CRYSON18,

respectivement pour les rayons X et les neutrons, permettent de calculer les courbes de diffusion

théorique de protéines à partir des fichiers PDB correspondants. Les courbes ainsi obtenues sont

d’une grande aide pour l’interprétation des profils de diffusion expérimentaux, ou encore pour

vérifier si la structure d’un fichier PDB correspond à la structure de la protéine en solution.

Le programme SASREF348 effectue la modélisation de la structure d'un complexe formé de

sous-unités dont la structure est connue par rapport à un ensemble de données SAS (courbes SAS des

sous-unités isolées et courbe SAS du complexe). Les données SAS des sous-unités doivent d’abord

être traitées par le programme CRYSOL ou CRYSON.

69