4.3 Evaluation des performances du MSV
4.3.2 Mise en évidence des corrélations
Une étude préliminaire a d’abord permis de vérifier les corrélations existantes entre les différentes variables stockées dans le PSF à l’aide de différents tests statistiques exposés ci-après. Ces tests sont tous basés sur le schéma suivant : On note 𝐻𝐻0, l’hypothèse nulle, qui correspond à l’indépendance des
139
distributions statistiques correspondant à des couples de variables. On teste s’il est significatif de rejeter cette hypothèse d’indépendance pour un échantillon de taille donné et un seuil fixé 𝛼𝛼. Le test consiste à comparer les valeurs- 𝑝𝑝8F
9 (ou p-value) calculées pour chaque couple de variables et à les comparer au
seuil 𝛼𝛼.
4.3.2.1 Description des différents tests
4.3.2.1.1 Test d’Hoeffding
Le test d’indépendance d’Hoeffding [326] a été utilisé pour mettre en évidence les corrélations qui existent entre les variables 𝑑𝑑, 𝑟𝑟𝑆𝑆, 𝜑𝜑𝑑𝑑 et 𝜃𝜃𝑑𝑑. Ce test non paramétrique est particulièrement bien adapté
ici car il est consistant pour toute distribution bivariée, et donc insensible à leur forme. Il permet ainsi de détecter toute nature de corrélation (pas uniquement linéaire ou de rang). Ce test estime la différence 𝐻𝐻 entre la loi de distribution jointe et le produit des lois marginales des deux variables, comme le montre l’équation (4-29).
𝐻𝐻 = �(𝐹𝐹12− 𝐹𝐹1𝐹𝐹2)2𝑑𝑑𝐹𝐹12 (4-29)
où𝐹𝐹12 est la loi jointe des deux variables mises en jeu et 𝐹𝐹1, 𝐹𝐹2 leurs lois marginales. Dans notre cas,
𝐹𝐹12 fait référence à l’histogramme 2D des variables 𝑣𝑣1et 𝑣𝑣2, et 𝐹𝐹1 et 𝐹𝐹2 à leurs histogramme 1D. Après
le calcul de la valeur- 𝑝𝑝 [326], si celle-ci est plus petite que le seuil 𝛼𝛼, alors la différence 𝐻𝐻 est significative (𝐻𝐻0 est rejetée) et 𝑣𝑣1et 𝑣𝑣2 peuvent être considérées comme corrélées. Les variables ont été
testées deux à deux pour montrer qu’il existe bien des corrélations entre elles. Pour ce faire, un échantillon de 213 particules a été utilisé.
4.3.2.1.2 Test de Pearson
Le test de Pearson [327] sert à mettre en évidence l’existence d’une relation de linéarité entre deux variables 𝑒𝑒 et 𝑦𝑦. Il calcule un coefficient de corrélation, 𝑟𝑟, compris entre -1 et 1. Si 𝑟𝑟 vaut 1 (respectivement -1), alors les deux variables sont reliées par une fonction affine croissante (respectivement décroissante). A la différence du test d’Hoeffding, ce test est paramétrique et est pleinement interprétable dans un cadre gaussien. Son utilisation dans notre situation n’est donc pas la plus pertinente. Il est présenté à titre de comparaison pour sa grande popularité. L’expression du test (coefficient de corrélation de Pearson) 𝑟𝑟 est donnée par l’équation (4-30) combinée à l’équation (4-31) :
𝑐𝑐𝑜𝑜𝑣𝑣𝑚𝑚𝑚𝑚= ∑ (𝑒𝑒𝑖𝑖 𝑖𝑖− 𝑚𝑚𝑚𝑚𝑚𝑚)�𝑦𝑦𝑖𝑖− 𝑚𝑚𝑚𝑚� (4-30)
𝑟𝑟 = 𝑐𝑐𝑜𝑜𝑣𝑣𝑚𝑚𝑚𝑚
𝑠𝑠𝑚𝑚𝑠𝑠𝑚𝑚 (4-31)
9 Une valeur de 𝑝𝑝 est le résultat d’un test statistique qui compare deux distributions. Elle représente, au
regard des données analysées, la probabilité d’obtenir des valeurs générées au moins aussi extrêmes que celles observées. Si la valeur de 𝑝𝑝 est inférieure à un seuil 𝛼𝛼 fixé au préalable, on rejette 𝐻𝐻0. Dans le cas
140
où 𝑚𝑚𝑚𝑚 (respectivement 𝑚𝑚𝑚𝑚) est la moyenne de la variable 𝑒𝑒𝑖𝑖 (respectivement 𝑦𝑦𝑖𝑖), la valeur prise par la
variable x lors de la réalisation i, 𝑠𝑠𝑚𝑚 (respectivement 𝑠𝑠𝑚𝑚) est l’écart type de la variable 𝑒𝑒𝑖𝑖 (respectivement
𝑦𝑦𝑖𝑖) et 𝑚𝑚 le nombre total de valeurs dans l’échantillon (ici 213 particules).
4.3.2.1.3 Test de Spearman
Le test de Spearman [328] est utile pour repérer les corrélations entre les rangs des valeurs prises par deux variables. Il met ainsi en évidence l’existence de corrélations entre les sens d’évolution des distributions. Ce test calcule, comme Pearson, un coefficient de corrélation 𝜌𝜌, compris entre -1 et 1. Plus précisément, le test de rang de Spearman peut être interprété comme un test de Pearson sur des données rangées. Ce test, également très répandu, permet de mettre en évidence des évolutions corrélées entre les distributions, mais ne permet pas non plus de tester tout type de corrélation. Il est présenté à titre de comparaison. L’expression du test 𝜌𝜌 est donnée par l’équation (4-32) :
𝜌𝜌 = 1 − 6 × ∑ 𝑑𝑑𝑚𝑚3− 𝑚𝑚 𝑖𝑖 𝑖𝑖2 (4-32)
où 𝑚𝑚 est le nombre total de valeurs dans l’échantillon (ici 213 particules) et 𝑑𝑑
𝑖𝑖 la différence arithmétique
entre les rangs attribués à un même objet, ici une particule, par les deux variables.
4.3.2.2 Résultats
La Figure 4-23 illustre les histogrammes 2D représentant, pour chaque source élémentaire et pour la source unique, le produit des lois marginales de la position radiale et de l’énergie. Si ces deux variables n’avaient pas été corrélées, ces histogrammes auraient été identiques à ceux illustrés en Figure 4-23 ce qui n’est clairement pas le cas. La même observation peut être faite pour toutes les combinaisons de variables 𝑑𝑑, 𝑟𝑟𝑠𝑠, 𝜑𝜑𝑑𝑑, 𝜃𝜃𝑑𝑑 prises deux à deux, récapitulées dans le Tableau 4-1 (voir paragraphe 4.1.2.2 ,
page 108).
Le Tableau 4-3 résume les résultats des différents tests en donnant les valeurs de 𝑝𝑝 et 𝐻𝐻 obtenues. Nous avons choisi une valeur de seuil 𝛼𝛼 égale à 0,01. Les résultats montrent que la dépendance entre les variables est confirmée. Il faut noter que pour le test d’Hoeffding, un nombre faible de particules, égal à 213, est suffisant pour montrer cette dépendance quel que soit le couple de variables étudié, contrairement
aux autres tests qui requièrent des échantillons statistiques plus grands pour atteindre les mêmes conclusions. Cependant, dans la majorité des cas, l’hypothèse d’indépendance est rejetée pour les trois tests.
141
(a) Cible (b) Collimateur primaire
(c) Cône égalisateur (d) Source unique
Figure 4-23 : Histogrammes 2D correspondant au produit des lois marginales de la position radiale et de l’énergie, pour les trois sources élémentaires et la source unique MSV.
Histogrammes 2D
Source 𝑟𝑟𝑠𝑠, 𝑑𝑑 𝑟𝑟𝑠𝑠, 𝜑𝜑𝑑𝑑 𝑟𝑟𝑠𝑠, 𝜃𝜃𝑑𝑑 𝑑𝑑, 𝜑𝜑𝑑𝑑 𝑑𝑑, 𝜃𝜃𝑑𝑑 𝜑𝜑𝑑𝑑, 𝜃𝜃𝑑𝑑
Cible
𝐻𝐻 4,78.10-1 1,08 8,19.10-1 4,78 9,92.10-1 3,40 𝑝𝑝 1,23.10-7 6,90.10-11 9,49.10-10 0,00 1,52.10-10 5,55.10-16 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Coll. primaire
𝐻𝐻 1,28 3,80 3,29 1,21.101 5,87 9,33 𝑝𝑝 1,25.10-11 2,22.10-16 7,77.10-16 0,00 0,00 0,00 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Cône égalisateur
𝐻𝐻 1,23 1,60 4,92 1,57.101 1,48.101 5,60.101 𝑝𝑝 1,83.10-11 1,36.10-12 0,00 0,00 6,79.10-4 3,07.10-8 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Source unique
𝐻𝐻 1,38.10-1 1,63 3,90.10-1 1,67.101 2,74 4,73 𝑝𝑝 1,02.10-3 1,11.10-12 6,83.10-7 0,00 5,44.10-15 0,00 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Tableau 4-3 : Résultats du test d’indépendance d’Hoeffding pour les trois sources élémentaires et pour la source unique.
142 Histogrammes 2D Source 𝑟𝑟𝑠𝑠, 𝑑𝑑 𝑟𝑟𝑠𝑠, 𝜑𝜑𝑑𝑑 𝑟𝑟𝑠𝑠, 𝜃𝜃𝑑𝑑 𝑑𝑑, 𝜑𝜑𝑑𝑑 𝑑𝑑, 𝜃𝜃𝑑𝑑 𝜑𝜑𝑑𝑑, 𝜃𝜃𝑑𝑑 Cible 𝑟𝑟 3,49.10-2 8,17.10-2 1,07.10-1 -1,21.10-1 8,99.10-2 -1,30.10-1 𝑝𝑝 9,25 10-6 1,45 10-11 1,22 10-21 7,07.10-31 8,15.10-15 4,92.10-42 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Coll. primaire
𝑟𝑟 1,10.10-1 -1,34.10-1 2,35.10-1 -3,75.10-1 2,43.10-1 -3,62.10-1 𝑝𝑝 4,29 10-29 3,23 1043 0,00 0,00 0,00 0,00 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Cône égalisateur
𝑟𝑟 -1,42.10-1 1,17.10-1 -2,83.10-1 -4,38.10-1 1,14.10-2 -2,59.10-2 𝑝𝑝 3,19 10-35 8,58 10-20 0,00 0,00 2,62.10-4 9,28.10-4 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Source unique
𝑟𝑟 1,16.10-2 1,73.10-3 1,26.10-2 -3,53.10-1 1,62.10-1 -2,43.10-1 𝑝𝑝 3,77 10-2 4,16 10-1 7,52 10-2 0,00 0,00 0,00 𝐻𝐻0 Non rejet Non rejet Non rejet Rejet Rejet Rejet
Tableau 4-4 : Résultats du test de Pearson pour les trois sources élémentaires et pour la source unique.
Histogrammes 2D
Source 𝑟𝑟𝑠𝑠, 𝑑𝑑 𝑟𝑟𝑠𝑠, 𝜑𝜑𝑑𝑑 𝑟𝑟𝑠𝑠, 𝜃𝜃𝑑𝑑 𝑑𝑑, 𝜑𝜑𝑑𝑑 𝑑𝑑, 𝜃𝜃𝑑𝑑 𝜑𝜑𝑑𝑑, 𝜃𝜃𝑑𝑑
Cible
ρ -5,17.10-2 1,04.10-1 9,33.10-2 -2,36.10-1 1,08.10-1 8,37.10-2 𝑝𝑝 1,73 10-3 2,64 10-19 3,08 10-19 0,00 1,73.10-23 1,13.10-8 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Coll. primaire
𝜌𝜌 6,45.10-2 -9,42.10-2 1,40.10-1 -3,86.10-1 2,44.10-1 -3,30.10-1 𝑝𝑝 8,11 10-9 1,96 10-21 3,64 10-34 0,00 0,00 0,00 𝐻𝐻0 Rejet Rejet Rejet Rejet Rejet Rejet
Cône égalisateur
𝜌𝜌 -1,26.10-1 1,23.10-1 -2,21.10-1 -4,15.10-1 1,06.10-2 -4,75.10-2 𝑝𝑝 2,78 10-28 2,16 10-25 0,00 0,00 4,70.10-2 1,63.10-8 𝐻𝐻0 Rejet Rejet Rejet Rejet Non rejet Rejet
Source unique
ρ -3,71.10-2 7,62.10-2 -1,05.10-2 -4,37.10-1 1,80.10-1 -1,78.10-1 𝑝𝑝 1,07 10-2 9,59 10-13 3,50 10-1 0,00 0,00 0,00 𝐻𝐻0 Non Rejet Rejet Non rejet Rejet Rejet Rejet
Tableau 4-5 : Résultat du test de Spearman pour les trois sources élémentaires et pour la source unique.
L’étude des histogrammes 2D a donc permis de confirmer qu’il existe bien des corrélations entre les quatre variables 𝑑𝑑, 𝑟𝑟𝑠𝑠, 𝜑𝜑𝑑𝑑 et 𝜃𝜃𝑑𝑑. Ces corrélations sont cependant difficiles à caractériser : elles ne sont pas
spécifiquement linéaires ou monotones. Ces résultats montrent clairement qu’il y a un intérêt à chercher à représenter toutes les corrélations dans le MSV développé et donc à modéliser le faisceau d’irradiation à l’aide d’histogrammes corrélés à quatre dimensions.
143