Chapitre 2 : Présentation des méthodes biophysiques principales utilisées : La diffusion de rayons
1. La diffusion aux petits angles (SAS)
1.2. Interprétation des données
Équation 11
1.2.Interprétation des données
1.2.1. Poids moléculaire Mw
L'intensité diffusée à l’angle zéro (2θ = 0) notée I(0) est proportionnelle à la masse moléculaire
Mw et à la concentration c des particules en solution, à condition que les particules aient la même
densité de longueurs de diffusion (i.e. la composition chimique moyenne des particules est
identique)338.
L’intensité à q = 0 ne peut être mesurée directement, cette zone correspondant au faisceau direct
étant masquée par le dispositif d’arrêt de faisceau. I(0) doit par conséquent être extrapolée depuis
les données expérimentales grâce à l’approximation de Guinier (voir partie suivante). Si
l’échantillon est monodisperse et que la masse moléculaire Mw ou la concentration c est connu, le
paramètre inconnu Mw ou c peut être obtenu à partir duI(0)en utilisant l’équation 12333 :
I(0) ∝ Mwc
Équation 12
1.2.2. Rayon de giration Rg
En mécanique, le rayon de giration Rg représente la distance par rapport à l'axe de rotation d’un
corps à laquelle il faut placer un point de masse égale à celle du corps pour qu'il ait le même moment
d'inertie que celui-ci. Le Rg d’une molécule est donc un indicateur de sa taille et de sa compacité.
Lors de mesures SAS, le Rg décrit la distribution de la densité de diffusion (par rapport au tampon)
autour du centre de densité de diffusion de la molécule. Des objets de mêmes masses mais de
formes différentes ont des valeurs de Rg différentes. Par exemple, un objet sphérique a un rayon
de giration plus petit qu’un objet allongé ou que tout autre objet de même masse.
L’approximation de Guinier339permet d’obtenir une estimation des intensités I(q) aux très petits
angles, autrement dit pour qRg ≤ 1. La diffusion dépendra de la taille de la particule selon une loi
générale indépendante de sa forme et de sa symétrie333.
I(q) = I(0)exp (−q²Rg
2
3 )
Équation 13
En traçant ln (I(q))en fonction de q2,les données sont alors sous la forme d’une ligne droite avec
une pente de −Rg2/3dans la zone de validité de l’approximation de Guinier (qRg ≤ 1), et le rayon
de giration peut ainsi être déduit. Pour des protéines globulaires, cette relation est valable pour
66
qRg≤ 1,3 puisque la zone linéaire est généralement plus large326. En extrapolant la droite à
l’ordonnée, I(0) peut être déduit.
Si la solution est monodisperse, le rayon de giration obtenu avec l’équation 13 peut être associé à
la forme et à la taille (si la masse moléculaire est connue) de la particule en solution. Dans le cas
d’un système polydisperse, la valeur de Rgest influencée par l’ensemble des particules en solution
et sa valeur sera alors une moyenne.
Les valeurs q plus élevées contiennent des informations sur la forme moléculaire. Pour les
macromolécules repliées, l'intensité de la diffusion diminue selon la loi de Porod340 :
I(q) ∝ q−4
Équation 14
Une autre méthode pour déterminer Rg et I(0) consiste à utiliser la fonction de distribution de
distances entre les éléments de volume à l’intérieur de la particule, dite fonction de distribution des
distances par paires P(r)341. Cette fonction correspond à la probabilité des distances interatomiques
et utilise donc le profil de diffusion entier et non pas seulement les valeurs à faibleq. Il s’agit de la
transformée de Fourier inverse de la courbe des intensités de diffusion I(q)d’un échantillon :
P(r) = r
2
2π2 ∫ q2
∞
0
I(q) eiq⃗⃗ r⃗ dq
Équation 15
Dans le cas de solutions monodisperses, il est décrit que :
I(q) = 4π ∫ P(r)sin (qr)
qr
Dmax
0
dr
Équation 16
I(0)est donc proportionnel à l’aire sous P(r) :
I(0) = 4π ∫ P(r)dr
Dmax
0
Équation 17
La limite maximale de l’intégrale est Dmax, qui représente la distance maximale entre deux points
dans une même particule.
L’équation 18 décrit comment Rg est relié à P(r). Pour l’appliquer, il est nécessaire d’avoir des
données avec des statistiques élevées et sans erreurs systématiques333 :
R2g= ∫ P(r) r
2dr
2 ∫ P(r) dr
67
1.2.3. Traitement des données et analyse standard en biologie
Les données brutes issues d’une mesure SAS sont réduites par une série de corrections qui
comprennent la normalisation de l'image par rapport à l'intensité du faisceau incident, l’étalonnage
de q, la correction pour la transmission de l'échantillon et la soustraction de l'arrière-plan, le
masquage des pixels indésirables, et l’étalonnage de l'intensité, suivies d'une intégration radiale.
La suite ATSAS342 contient plusieurs des programmes spécialement conçus pour analyser les
données SAXS et SANS des biomacromolécules en solution une fois les données réduites et
constitue la suite de programmes majoritairement utilisée dans le domaine. Les programmes
présentés ci-dessous font partie de la suite ATSAS.
Les intensités du tampon sont soustraites des intensités des échantillons respectifs en utilisant le
logiciel PRIMUS343 afin d’obtenir la courbe de diffusion SAS. Différentes informations peuvent
être obtenues selon la région de la courbe étudiée en utilisant ce même logiciel (voir figure 34) :
▪ Les rayons de giration Rg des échantillons sont extraits en utilisant l’approximation de
Guinier339 (équation 13). L’information du Rg peut être extraite des premiers points de la courbe
en calculant la pente d’une droite les alignant. La possibilité d’aligner une droite sur ces points
et de valider l’approximation de Guinier renseigne sur l’état de l’échantillon (agrégé ou non).
▪ Le contenu en flexibilité de l’échantillon peut être étudié par le tracé de la courbe de Kratky.
Les macromolécules globulaires suivent la loi de Porod (équation 14) et ont des courbes en
forme de cloche. Les molécules allongées, comme les protéines dépliées, n'ont pas ce pic et
sont en légère augmentation ou ont un plateau dans la gamme q plus large.
▪ L’analyse de la fonction P(r) (équation 18) renseigne sur la forme des protéines en solution.
Alors que cette courbe a une forme de cloche pour une protéine globulaire, elle présentera une
queue plus longue pour les protéines allongées et plusieurs pics pour une protéine
multi-domaine. La distance maximale Dmax de la protéine peut également être estimée à partir de
cette analyse des distances, représentant la distance extrapolée à P(r) = 0.
Il est courant d’analyser les données obtenues par SAS non pas en étudiant les résultats d’une seule
concentration mais en combinant une faible et une forte concentration. Une mesure SAS sur une
faible concentration apporte des informations précises aux petits angles, appelée la zone ou région
de Guinier, alors que les informations aux plus grands angles ne sont pas accessibles car les données
sont trop bruitées. En revanche, les mesures à forte concentration sont moins précises dans la
région de Guinier (risque d’agrégation ou de répulsion) mais plus résolutives et donc précises sur
le facteur de forme. Une courbe chimère peut être réalisée en fusionnant deux courbes sur une
région couvrant quelques dizaines à une centaine de points, juste après la région de Guinier.
68
Figure 34 : Courbes théoriques de diffusion et d'analyse SAS. Adapté de Putnam, C. D., et al. (2007)326.
Le programme CHROMIXS permet de tracer un ensemble de données SAXS, généré lors d’une
mesure SEC-SAXS ou SEC-SANS (chromatographie d’exclusion de taille en ligne SAXS ou
SANS), en fonction du temps d'élution. Cela permet de sélectionner des zones de tampon et
échantillons d’intérêt et d'établir une courbe SAS, qui sera ensuite traitée par le logiciel PRIMUS.
Pour la visualisation structurale ainsi que la validité des modèles, les programmes DAMMIF344 et
DAMMIN345 sont utilisés pour générer des modèles ab initio en billes en se basant sur la valeur de
Dmax calculée par le logiciel GNOM346.
Le programme OLIGOMER343 est utilisé pour déterminer les fractions volumiques de différentes
espèces d’un mélange de protéines. Les facteurs de forme de chaque espèce peuvent être générés
par ffmakeret utilisés par OLIGOMER pour le calcul des proportions.
Etant donné que l’intensité de diffusion observée pendant une expérience de SAS est la moyenne
sur toutes les orientations des transformées de Fourier des intensités de longueur de diffusion ρn,
ou des densités électroniques ρe des particules en solution, il est possible de calculer les courbes de
diffusion théorique si ρn(𝑟 ) ou ρe(𝑟 ) sont connus. Les programmes CRYSOL347 et CRYSON18,
respectivement pour les rayons X et les neutrons, permettent de calculer les courbes de diffusion
théorique de protéines à partir des fichiers PDB correspondants. Les courbes ainsi obtenues sont
d’une grande aide pour l’interprétation des profils de diffusion expérimentaux, ou encore pour
vérifier si la structure d’un fichier PDB correspond à la structure de la protéine en solution.
Le programme SASREF348 effectue la modélisation de la structure d'un complexe formé de
sous-unités dont la structure est connue par rapport à un ensemble de données SAS (courbes SAS des
sous-unités isolées et courbe SAS du complexe). Les données SAS des sous-unités doivent d’abord
être traitées par le programme CRYSOL ou CRYSON.
69
Dans le document
Étude du mécanisme d’action du protéasome PAN-20S par diffusion de neutrons aux petits angles résolue en temps
(Page 70-74)