R EVUE DE STATISTIQUE APPLIQUÉE
J. P AGES
L. L E C ALVEZ
Analyse statistique d’une formation limoneuse en vue de préciser son origine
Revue de statistique appliquée, tome 28, n
o2 (1980), p. 45-60
<http://www.numdam.org/item?id=RSA_1980__28_2_45_0>
© Société française de statistique, 1980, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ANALYSE STATISTIQUE D’UNE FORMATION LIMONEUSE EN VUE DE PRÉCISER SON ORIGINE
J.
PAGES*
et L. LECALVEZ**
1. - INTRODUCTION
Le Massif Armoricain est constitué de roches très variées. Par contre, les sols
qui
les surmontent sont, dupoint
de vuegranulométrique,
assez uniformes. Ils renferment relativement peud’argile
et desables, mais, beaucoup
de limons.(Par-
ticules fines
comprises
entre 2 et 50microns).
Ce contraste entre la diversité des roches et
l’homogénéité
des sols a induit denombreux travaux sur
l’origine
deslimons ; proviennent-ils
- des roches
sous-jacentes ?
- d’un ou de
plusieurs
apports éoliens(Loess) ?
- ont-ils une
origine
mixte(mélange) ?
L’étude au
microscope
met enévidence,
dans les sols limoneux deBretagne centrale,
à la fois des minéraux provenant des roches locales et des minéraux absents de ces roches.Dans cette
région,
les limons ont donc uneorigine
mixte. Lesanalyses
chi-miques
confirment cette doubleorigine.
Pour
compléter
cette étudequalitative,
il convient d’identifier les constituants initiaux dumélange
et d’évaluer leursproportions
relatives danschaque
échantillon.Sur le
terrain,
ilexiste, naturellement,
des variations entre lesproportions
desconstituants du
mélange.
Celles-ci entraînent des variations dans lescompositions granulométriques
des sols.Une
analyse statistique
de ces variations devrait permettre de déterminer lacomposition
des constituantsinitiaux,
à condition que les sols n’aient pas subi de transformationspostérieures
aumélange
tropimportantes -
laprésence
deminéraux très
fragiles (Hornblende)
permet de penser que cette condition est réalisée.Pour cette
étude,
troisséquences,
situées sur les troisprincipales
roches dela
région - grès, granite,
schistes - ont été retenues. Danschaque séquence, plu-
sieurs échantillons ont été
prélevés
etanalysés,
dupoint
de vue de leurcomposition
(*) Statistique et Informatique ENSAR (**) Sciences du Sol INRA ENSAR.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
Mots-Clés :
Mélange, Analyse
enComposantes Principales, Pédologie,
Granulo-métrie, Modèle,
Limon.46
granulométrique(1).
En outre, ondispose
de lacomposition chimique
dequelques
échantillons.
L’analyse statistique
de ces donnéeschimiques
étant conduite selon les mêmesprincipes
que celle des donnéesgranulométriques,
nous nous référeronsdans le texte essentiellement à ces
dernières, qui
sont lesplus fréquentes
car beau-coup moins coûteuses à obtenir.
2. - LE
MODÈLE
DEMÉLANGE
2.1. - Notations Soit : .
-
Xij,
la mesure de lavariable j
pour leprélèvement
i.-
I,
le nombre deprélèvements
i =1, ,1
-
J,
le nombre de classesgranulométriques j = 1 ,
J-
XiJ ,
l’ensemble des mesures pour leprélèvement
i :-
XIJ ,
l’ensemble des mesures pour tous lesprélèvements :
Ces notations sont
récapitulées
sur lafigure
1 :FIG. 1. - Récapitulation des notations
(1) Un sol est constitué de particules de différentes tailles. Classiquement, on distingue
8 classes de tailles.
Argile : particules comprises entre 0 et 2 microns
Limon fin : " " 2 et 20 microns Limon grossier " 20 et 50 microns
Sable 1 : " " 50 et 100 microns Sable 2 : " " 100 et 200 microns Sable 3 : " " 200 et 500 microns Sable 4 : " " 500 et 1000 microns Sable 5 : " " 1000 et 2 000 microns
La composition granulométrique d’un échantillon indique la masse totale des particules
de chaque classe ; elle s’exprime généralement en pourcentage.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
47 2.2. - Le modèle de
mélange
Si la formation limoneuse est issue du
mélange
entre deuxmatériaux, alors,
la
composition granulométrique
desprélèvements
que l’on y fait doitprésenter
une certaine structure. Nous
appelons
cette structure "modèle demélange".
Ce modèle est
composé
de deuxpropositions :
Ml : il existe deux constituants initiaux Y et
Z ;
nous noterons leur compo- sitiongranulométrique respectivement
est la teneur en éléments appartenant à la
classe j
pour le constituant initial noté Y(resp. Z).
M2 :
chaque prélèvement
i observé est unmélange
des constituants Y etZ ; soit,
enappelant Pi
laproportion
du constituant Y :En
réalité,
laproposition
M2 ne serajamais
vérifiée exactement pour deux raisons :-
Xij
est une mesuresujette
à erreur ;- il s’écoule nécessairement un certain temps entre la réalisation du
mélange
et notre observation.
Aussi,
les matériaux issus dumélange
vont subir une transfor-mation
pédologique,
et c’est le résultat dumélange et
de la transformation post-mélange
que l’on observe.Ceci conduit à une nouvelle formulation de la
proposition
M2 :où
Aij
est une variable aléatoirequi représente
à la fois les erreurs de mesure et latransformation post-mélange.
Dans ce
modèle, Xij
est une variablealéatoire, Pi , Yj, Zj
sont desparamètres.
Pour estimer ces
paramètres, quelle
que soit la méthodeutilisée,
il est nécessaire de luiadjoindre
uneproposition supplémentaire :
Sans cette
hypothèse,
il seraimpossible
dedistinguer
les influencesrespectives
sur
Xij
dePi , Yj , Zj
d’une part, deAij
d’autrepart.
Sauf cas trèsparticulier,
il estcertain que M3 n’est
jamais
strictementvérifiée,
mais il est vraisemblable que les situations naturelles ne s’en écartent pastrop. (Nous
citerons les arguments mis enjeu
par cette affirmationaprès
laprésentation
de la méthode que nous proposons,ce
qui
permettra de mieux enapprécier
laportée (§ 343)).
Il convient de remarquer que la
méthodologie
que nous allonsdévelopper
à
partir
d’unexemple,
est deportée
assezgénérale.
Les modèles demélange
ontdéjà
faitl’objet
deplusieurs
travaux.Généralement,
les composants initiaux sontconnus
(e.g.
P. CAZES et P.Y. TURPIN[1]),
et l’estimation des pourcentages s’effectue au moyen d’unerégression
sous contraintes. Les situations où les compo- sants sont inconnus sontplus
rares, mais existent : à propos desmargarines,
H. MARTENS et al.
[4]
ontproposé
une méthode trèsproche
de la nôtre.Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
48
2.3. - Le
problème posé
en terme de modèle demélange
Soit :
Les
données
observées serontcompatibles
avec le modèle demélange
si l’on peuttrouver PI , J , ZJ
tels queXIJ
ne soit pas tropdifférent de XIJ.
Pourcela,
il est nécessaire de définir un critère pour mesurer l’écart entre
XI J
etXlj.
Leplus
naturel est le critère des moindres
carrés,
soit :Le
problème pédologique
peut donc être formulé ainsi : trouver une estima- tion dePI , Yj , Zj qui
minimiseQ ;
si la valeur calculée deQ
estgrande,
onrefusera
l’hypothèse
selonlaquelle
la formation limoneuse étudiée est issue du mé-lange
de deuxmatériaux ;
si la valeur calculée deQ
estpetite,
onacceptera l’hypo-
thèse et
simultanément,
leproblème
de l’estimation desparamètres
sera résolu.Une difficulté se
présente
pourpréciser
ce que l’onappelle
une valeur deQ grande
oupetite.
Il estpossible d’envisager
un teststatistique,
mais il convientplutôt
ici deprofiter
de la natureparticulière
duproblème posé.
Eneffet,
sil’hypo-
thèse de
mélange
estjuste, alors,
les composants des matériaux dedépart
nepeuvent
êtrequelconques :
l’un est nécessairement unproduit
de l’altération dusubstrat,
et l’autre un apport éolien.Or,
nousdisposons
d’idées apriori précises
sur ces
compositions.
Le test del’hypothèse
demélange
consistera donc à vérifier que les estimations deYJ
etZJ qui
minimisentQ
sont cohérentes aux yeux dupédologue.
Nous avons ici un critère de validation externe(par
rapport aux don-nées) qui
est trèspuissant
en ce sensqu’il
est trèsimprobable
que nousacceptions l’hypothèse
demélange
si elle est fausse.De toutes
façons,
pour lepédologue,
leproblème
du test del’hypothèse
demélange
est relativement secondaire. Eneffet,
nous avonssignalé qu’il
existe des argumentsqualitatifs (présence
de tel ou tel minéral parexemple)
incitant à penser que telle formation limoneuse est issue d’unmélange
de deux matériaux. C’est l’estimation desparamètres qui
est lepoint
essentiel.3. - ESTIMATION DES
PARAMÈTRES
DUMODÈLE
DEMÉLANGE
3.1. -
Remarque préliminaire
Nous sommes en
présence
d’unsystème
de 1 x Jéquations
du type :Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
49
Le
problème
consiste à estimer lesPi, Yi
etZj
en minimisantQ = 03A3 2ij
Les
paramètres
à estimer doivent vérifier certaines contraintes :Ce
problème
peuts’interpréter
comme unerégression
non linéaire sous contraintes, avec1
+2J paramètres et I
xJ équations.
De cepoint
de vue, sarésolution est extrêmement
complexe.
Enfait,
nous proposonsplus
loin unesolution très naturelle et relativement
simple.
3.2. -
Interprétation géométrique
On
peut
considérerchaque XiJ
comme un élément deJ’espace RJ . Supposons
trouvées les estimations
PI , J et ZJ. O n
remarquera queYJ
et2j appartiennent
à
RJ
et queXiJ = PiYJ
+(1 - Pi) ZJ appartient
au segmentqui
relieYj
etZj.
En outre Q est la somme des carrés des distances
(au
sens de la distanceeuclidienne
usuelle)
entreiJ
etXij.
Ainsi,
XiJ peut s’interpréter
comme laprojection
deXij
sur le segmentreliant
Yj
etZ J . (S’il
n’en était pasainsi, Q
ne serait pasminimisé).
Ces résultats sont
récapitulés
dans lafigure
2.FIG. 2. - Interprétation géométrique
du modèle de mélange
Revue de Statistique AppliquM, 1980, vol. XXVIII, n° 2
50
Nous sommes ainsi conduits à une nouvelle formulation du
problème
d’esti-mation : rechercher les deux
points YJ et ZJ de RJ
tels que l’inertie de l’ensemble despoints XiJ
par rapport à l’axe reliantYj
etZJ
soit minimale.D’après
cetteinterprétation,
ilapparaît
que, siYJ
etZJ
sonttrouvés,
il existed’autres
points et qui
conduisentà la
même valeur du critère Q : cespoints
sont ceux de la droite passant par
Yj
etZj.
Il existe donc une double infinité de solutions.En
réalité,
tous lespoints
de cette droite ne conviennent pas : on neprendra
en compte que ceux
qui
satisfont les contraintes. On remarquera que les con-traintes C4 et C5 sont
automatiquement
vérifiées. Eneffet,
tous lespoints Xij
vérifient
Xii
= 100. L’ensemble duproblème
se situe donc dansl’hyperplan
de
RJ contenant
lespoints
dont la somme descomposantes
vaut 100.(Figure 3).
FIG. 3. - Interprétation géométrique du modèle de mélange
mettant en évidence les contraintes C4 et CS
3.3. - Méthode
proposée
La méthode que nous proposons comporte 3
phases :
Phase 1 : détermination de la droite contenant les
YJ
et lesZJ.
Phase 2 : détermination des segments de cette droite
qui
contiennent lesYJ
et les
ZJ
satisfaisant les contraintes.Phase 3 : détermination de
PI
compte tenu de lamultiplicité
desYJ
etZj.
Phase 1 : détermination de la droite contenant les
YJ
et lesZJ .
Le
problème
consiste à rechercher dansRJ ,
l’axe affine â tel que l’inertie par rapport à â du nuageNI
despoints Xij
soit minimum.D’après
le théorèmede
Huyghens,
cet axe passe par le centre degravité
deNI.
Il conviendra donc de réaliser uneanalyse
en composantesprincipales (A.C.P.)
non normée du tableauXI J :
l’axe A est lepremier
axe fourni par cetteanalyse.
A ce niveau, se pose le
problème
de l’identification de l’axe A avec uneopposition substrat-apport.
Sous réserve de confirmationlorsque
l’ondisposera
des
estimations,
il estpossible d’accepter
l’identificationd’après
l’examen des corrélations entre les variables initiales et A.(Les oppositions
de variables misesen évidence par â
correspondent-elles
aux idées apriori
que l’on a sur la diffé-rence entre le substrat et
l’apport ?).
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
51
De ce
point
de vue, le pourcentage d’inertie associé à A n’est pas un indica-teur de la validité de
l’hypothèse
demélange,
maisplutôt
un indicateur de l’in- fluence del’origine
desprélèvements
sur leurcomposition
actuelle.Phase 2 : détermination des
YJ
etZj.
Cette
phase
est décrite par le schéma de lafigure 4, qui représente
l’axe Afourni par
l’analyse
en composantesprincipales.
On détermine d’abord le segment
Sc,
ensemble despoints
de A vérifiant les contraintes C2 et C3 : on obtient ainsi lespoints Y oJ
etZoj.
En
projetant
le nuageNI
surâ,
on détermine le segmentSe , plus petit
seg- ment contenant lesprojections
desXiJ.
Soit
Xy J
etZJ
les extrémités deSe
Pour que la contrainte Cl soit
vérifiée, YJ
etJ
doivent être extérieurs àSe.
Les trois contraintes seront donc vérifiées dans l’ensemble
complémentaire
de
Se
dansSc ;
cet ensemblecomprend
deux segments : l’un,Sy,
contient lesvaleurs
possibles
deYJ ,
l’autreSZ,
contient les valeurspossibles
deZJ.
FIG. 4. - Détermination des ensembles des valeurs de
J (Sy)
et deJ(SZ)
Phase 3 détermination de
PI.
La valeur
de PI dépend
de celles deYJ
etJ.
Comme ces dernières ne sontpas
uniques,
on pourra proposerplusieurs
valeurs dePI.
Toutefois,
les différentesestimations PI
ont en commun l’ordre de leurs composantes. Eneffet,
pourchaque PI,
les valeursPi
respectent l’ordre desXiJ
sur l’axe factoriel. La méthode
proposée
fournit de manièreunique
un classement des échantillons selon leurplus
ou moinsgrande proportion
en matérield’apport.
A Si le classement ne suffit pas, on pourra
calculer
les valeurs extrêmes dePI.
Eneffet,
pourchaque
individu i, la valeur dePi (proportion
du matérielY)
la
plus grande
sera obtenue en choisissant commevaleur
deYJ
la valeur laplus proche
de l’échantillon(Xyj)
et comme valeur deZJ
laplus éloignée (0J).
Réci-proquement, la valeur de
Pi
laplus petite
sera obtenue en choisissant pourYJ
et
Z J
lecouple j , zJ).
Ceprocédé
estrigoureux,
maisrisque
de conduire à des intervalles étendus defaçon exagérément pessimiste ; pratiquement,
on pourrase contenter de l’ordre de
grandeur
dePI,
calculé àpartir
ducouple :
Revue de Statistique Appliquée, 1980, vol. XXVII1, n° 2
52 3.4. - Discussion sur la méthode
3.4.1. - Les estimations des composants initiaux
Nous avons
indiqué
que lesZJ
etYJ
n’étaient pasuniques :
tous lespoints
d’un segment de droite convenaient.
Ainsi, pratiquement
nous calculerons0J
et
zJ.
Il convient de remarquer que ces bornes ne constituent pas un intervalle de confiance au sens usuel du terme.Chaque
borne est elle-même une estimationponctuelle,
et notre modèle ne contient aucunehypothèse probabiliste.
La
longueur
des segments(0J, et (Xyj 0J) dépend
de laprésence
ou non dans l’échantillon de
prélèvements qui
sontproches
des limites des con-traintes 0
Xij
100. Ceci est illustréfigure
5 àpartir
d’unexemple
trèssimplifié
ou seules deux classes interviennent : la situation de la
figure
5a conduit à des intervalles delongueur beaucoup plus petites
que ceux de lafigure 5b,
et ceciindépendamment
de laqualité
del’ajustement.
FIG. 5. - Influence de l’échantillonnage sur la longueur
des intervalles contenant les estimations de l’apport et du substrat.
Sy
etSa
Pratiquement,
cette conditionimplique,
dansl’hypothèse
demélange
que :a)
Il existe dans l’échantillon desprélèvements
trèsproches
des composants initiaux.b)
Les composants initiaux sont telsqu’ils
saturent certaines contraintes(certaines
de leur composantes sont nulles parexemple).
Il est
possible d’agir
sur ces deux conditions :a)
en choisissant l’échantillon de tellefaçon
que certainsprélèvements
soienttrès
proches
del’apport
et d’autres trèsproches
du substrat. Ceci estpossible
par desimples
observations sur le terrain ;b)
en modifiant lesystème
de contraintes. Eneffet,
nous avonsimposé jus- qu’ici
aux différents pourcentages d’êtrecompris
entreO’et
100.Or,
ondispose généralement
d’idées apriori
sur leproduit
de ladégradation
de,la
rochemère, laquelle
est connue.Revue de Statistique Appliquée, 1980, vol. XXVII I, n* 2
53
Ce dernier
point
revêt unegrande importance pratique
car unsystème
decontraintes trop
général risque
de conduire à des estimations très vagues. Toute-fois,
il convient den’ajouter
des contraintesqu’avec prudence.
A
Pratiquement,
on pourraappliquer l’algorithme
suivant : calcul deYJ
etZ J
sans contraintesupplémentaire
faire
examen de
YJ
etZJ
tant que
(il
existe une teneur"irréaliste")
calcul de
J
etZJ
avec une contraintesupplémentaire
à propos de la teneur laplus
irréaliste.refaire
3.4.2. - Robustesse
Lors de la
présentation
dumodèle,
nous avonsindiqué
quel’hypothèse
H :E
(Aij)
= 0i = 1 , 1 ; j
=1 ,
J n’estjamais
strictement vérifiée mais que les données réelles ne s’en écartentprobablement
pas trop.En ce
qui
concerne les donnéesgranulométriques,
l’écart leplus important
à
l’hypothèse
H est dû aulessivage
del’argile. Or,
on pourra considérer que cedernier n’influe pas trop sur la
qualité
des estimations si :a)
Lelessivage porte
sur de faiblesquantités.
b)
Lelessivage agit "indépendamment"
de la teneur en apport en ce sensqu’il
estpossible
de rencontrer des échantillons riches en substrat aussi bien à degrandes qu’à
depetites profondeurs.
Cette condition est réalisable du fait de l’éro- sionlorsque
l’on étudie un terrainprésentant
despentes.
c)
Le substrat etl’apport
ne diffèrent pas essentiellement dupoint
de vue del’argile.
3.4.3. - Les données
chimiques
La
présentation qui
vient d’être effectuée ne considère que les donnéesgranulométriques. Or,
pour certainsprélèvements,
nousdisposons
enplus d’analyses chimiques, (Ces analyses
sont coûteuses, et n’ont été réalisées que sur une dizaine deprélèvements).
Naturellement,
toute laprésentation précédente
resteapplicable
pour les donnéeschimiques.
Apartir
d’uneséquence
deprélèvements,
on pourra donc réaliser 2 traitementsstatistiques ;
celuiqui
concerne les donnéeschimiques
devraêtre surtout considéré comme un
complément
de l’autrepuisqu’il
nes’appuie
quesur un nombre restreint de
prélèvements ;
mais cecomplément joue
un rôle im- portant dans le validation des résultatspuisqu’il
conduit à des estimations dePI qu’il
est facile de comparer avec celles calculées àpartir
des donnéesgranulomé- triques.
Si les deux estimations de
PI
sontvoisines(2 ),
alors on peutenvisager
l’estima-(2) On a vu que l’information contenue dans
PI
consistait surtout dans l’ordre desPi.
On pourra donc mesurer la proximité entre les deux estimations à l’aide d’un coefficient de corrélation de rang.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
54
tion des
compositions chimiques
des constituants initiaux. Trois démarches sontpossibles :
D1 : estimation à
partir
des seules donnéeschimiques.
D2 : estimation à
partir
des donnéeschimiques
etgranulométriques qui
concernent les
prélèvements
pourlesquels
ondispose
des deux types de données.D3 : estimation restreinte à
YJ
etZJ
àpartir
des donnéeschimiques. PI
est alors considéré comme connu et on utilise les valeurs
PI
issues des donnéesgranulométriques.
Pour comparer ces trois
démarches,
nous nous référerons à l’ensemble des données(granulométrie
+chimie)
telqu’il
estprésenté figure
6.FIG. 6. - Représentation des données
granulométriques
et chimiques
La démarche Dl
reprend
exactement ce que nous avons vu pour laIranulo-
métrie, appliquée
cette fois à lachimie,
c’est-à-dire à un tableau de tailleIl
xr2.
La démarche D2 recouvre une A.C.P. réalisée sur les individus
possédant
à la fois
des données granulométriques
etchimiques,
c’est-à-dire sur un tableau de taille :I1
x(J1 + J2).
Toute laméthodologie précédente s’applique
à condi-tion de
remplacer
les contraintes C4 et CS parLa démarche D3
comprend
deuxétapes :
a)
A.C.P. sur les donnéesgranulométriques (à partir
du tableau de taille1;
xJ1).
Cette A.C.P.nous fournitPI.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
55
b)
On ré-écrit le modèle demélange
pour la chimie en supposantPI
connu(PI
est fourni par lagranulométrie) :
On
reconnaît
là un modèlelinéaire,
dont on pourra estimer lesparamètres
au moyen de
1; régressions simples.
Lesparamètres
à estimer,Yj
etZj,
étant despourcentages,
doivent vérifier les contraintes habituelles depositivité
et de som-mation à 100. En
fait,
des considérationsempiriques
fondées sur la natureparti-
culière des données:- Vi
1 , -f 1 :
0Pi
1 ; lesPi "remplissant"
à peuprès (0, 1) (cf.
§ 342,
conditiona))
laissent supposer que, si le modèle linéaire convient, ces contraintes seront
pratique-
ment vérifiées
automatiquement.
Nous
préférerons
la démarche D3 : elle conduit à une valeurunique
dePI compatible
avec les donnéesgranulométriques
etchimiques
etqui présente
leplus
fort
rapport -
nombre dedonnées/nombre
deparamètres
estimés - dans l’estima- tion descompositions chimiques
des constituants initiaux.Si toutefois les estimations des
compositions chimiques
par D3 ne satisfont pas les contraintes, et si l’on nedispose
pas des programmes derégression adaptés,
la démarche D2 convient
parfaitement.
3.4.4. - La mise en oeuvre
Elle est très
simple
et s’effectue en 2 temps. Toutd’abord,
on réalise uneA.C.P. non normée
(à
l’aide d’un programmestandard)
sur le tableauXIJ.
Lesrésultats sont, d’une
part imprimés,
et d’autrepart,
stockés en fichiers permanents.Dans un deuxième temps, ces fichiers sont introduits en entrée dans un programme
spécifique qui
éditeYoJ , xJ, zJ, ,Zoj ,
les différentes valeursde PI
etXIJ .
4. - EXEMPLE D’APPLICATION
La
présentation qui
suit est très sommaire : elle vise à montrer comment les considérationsprécédentes
peuvents’appliquer
à des données naturelles et non àexploiter complètement
un ensemble de données.Ainsi,
bon nombred’idées,
soulevées à propos de cette étude seront seulement citées et nonargumentées.
Dans le même
esprit,
nousprésenterons l’analyse
des donnéesgranulométriques
d’une
unique séquence,
en ne mentionnant que dans la conclusion lesanalyses
se fondant sur les données
chimiques et/ou
sur les autresséquences.
Le lecteurdésireux
d’approfondir
nos conclusionspédologiques
se reportera avecprofit
à lathèse de L. LE CALVEZ
(cf. [3 ]).
Revue de Statistique Appliquée, 1980, vol. XXVII I, n° 2
56 4.1. - Les données
Les échantillons
proviennent
d’un sol limoneux àlimono-sableux, qui
sesitue le
long
d’un versant, au-dessus d’une arènegranitique sableuse,
auSoum, près
dePontivy (Morbihan).
Les
points
deprélèvements -profils-
sontrégulièrement espacés
lelong
de la
pente.
Achaque point
deprélèvement,
on recueille des échantillons de sol à différentesprofondeurs ;
66 échantillons ont été recueillis etanalysés
dupoint
de vue
granulométrique,
10 d’entre eux ont donné lieu à uneanalyse chimique.
4.2. - Les résultats
A A
Phase 1 : détermination de la droite contenant les
YJ
et lesZJ.
Cettephase s’appuie
sur une
analyse
en composantesprincipales
non normée du tableauXI J .
Les pour-centages d’inertie des différents axes sont les suivants :
1 er
axe :79,8
% 2e axe :10,3
% 3 e axe :5,9%
4e axe:
3,1 %
Il se
dégage
un axeprépondérant qui explique
80 % des variations des mesures.Les corrélations des variables à cet axe sont de :
Argile (A) : 0,310
Limon fm
(L.F.) : 0,766
Limon
grossier (L.G.). 0,981
Sable très fin(S1) : -0,750
Sable fin(S2) : -0,940
Sable moyen(S3) : -0,927
Sablegrossier (S4) : -0,961
Sable trèsgrossier (S5) : -0,861
A
l’exception
del’argile,
toutes les variables sont fortement correlées à l’axe.Celui-ci oppose les
limons, qui présentent
des corrélationspositives,
auxsables,
dont les corrélations sontnégatives.
Ilsépare
donc les échantillons dont la compo- sition est voisine de celle des arènes(sables),
des échantillons dont lacomposition apparaît
apriori proche
de celle des loess.Aussi,
cet axe peuts’interpréter
en termede
mélange.
Il est doncpossible,
àpartir
de cet axe, deprocéder
à l’estimation deYJ
etZJ.
Phase 2 : détermination de
YJ
etJ
Cette
phase s’appuie
sur un programme utilisant en entrées les résultats de l’A.C.P.. Les estimations fournies sont les suivantes.Matériel Y
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
57 Matériel Z
Les écarts entre les deux estimations
ponctuelles
deYJ
sont relativement étroits. La composantequi
s’annule estS3,
maisS2, S4,
S5 sontégalement
voisinsde zéro. Cette
composition granulométrique,
du doublepoint
de vue del’aspect sigmoïde
de sa courbecumulative, (fig. 7)
et de l’absence de fractions sableuses moyennes etgrossières,
estcaractéristique
d’un limon éolien.FIG. 7. - Courbes granulométriques cumulatives de différents matériaux
A côté des courbes estimées, une courbe de l’arène et une courbe de loess (Apport éolien) typique ont été représentées
Les écarts entre les deux estimations
zJ
et0J
deZJ
sont assez élevés.Les courbes cumulatives
correspondantes
ont un aspect concave,comparable
à celui des arènes
sous-jacentes. Or,
il estimprobable
que cette arène en s’altérant donne un matérielqui
ne contienne pas de limongrossier (cas
deZoj)
et même,qu’elle
fournisse moins de limongrossier qu’elle
n’en renferme(soit
12 % enmoyenne).
Nous pouvons donc admettre que ce matériel Z ne contient pas moinsRevue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
58
de 12 % de limon
grossier,
et, calculer une nouvelle estimation(’0J) qui
tiennecompte de cette contrainte. Soit :
La fourchette entre
Xjj
et’0J
est relativement étroite.Phase 3 : détermination de
PI
Les deux composants du
mélange
étantestimés,
il devientpossible
de donnerleur
proposition
relative danschaque
échantillon. Cesproportions
sont fournies par le même programmequi
calcule les estimations deYJ
etZj.
Notons que l’échantil- lon leplus
riche en substrat en contient entre 89 et 100%,
leplus
riche enapport
en renferme entre 92 et 100 %. Les diverses
proportions
ont étéreportées
sur laséquence (fig. 8).
Il sedégage
une allure enenveloppes,
ouvertes versl’aval,
lesplus
forts pourcentages
d’apports
se situant au c0153ur de cesenveloppes.
Cette distribu- tions’explique
aisément par l’érosion et s’accorde avec l’existence d’unapport
éolien.4.3. - Conclusion
Dans cette
séquence
du Sourn, 80 % des variationsgranulométriques
peuvent êtreexpliquées
par lemélange
entre deux matériaux. La connaissance de leur com-position
permet d’identifier leurorigine :
- l’un est un apport
éolien ;
- l’autre est issu de l’arène
sous-jacente.
Par
ailleurs,
le traitement des donnéeschimiques
de cetteséquence,
defaçon
autonome
d’abord, puis couplé
avec les donnéesgranulométriques,
confirme cerésultat,
etpermet
de mettre en évidence que, le matériel Z dérive de l’arène paraltération,
et non par unesimple fragmentation mécanique
desgrains(3 ).
De
plus, l’analyse
de deuxséquences
situéeslégèrement plus
aunord,
l’unesur
quartzite,
l’autre surschiste,
a conduit à des résultats similaires.L’apport,
mis en
évidence, apparaît légèrement plus grossier,
cequi
est enplein
accord avecl’origine septentrionale généralement
avancée.5. - CONCLUSION
Au cours de ce
travail, l’analyse
en composantesprincipales (A.C.P.)
estapparue sous
l’aspect
peu habituel d’une méthode d’estimation desparamètres
(3) Il n’y a pas lieu de présenter ici les résultats complets, qui se trouvent dans LE
CALVEZ 1979 [3]. A propos des données chimiques, nous signalerons simplement que dans la démarche D3, les régressions simples ont conduit à des estimations vérifiant les contraintes.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 2
59
Revue de Statistique Appliquée, 1980, vol. XXVII I, n" 2
60
d’un modèle construit a
priori :
c’est là queréside,
à nos yeux, leprincipal
intérêtméthodologique
de cette étude.Mais il convient de remarquer que,
indépendamment
du modèle demélange,
l’A.C.P. peut êtreappliquée
directement à nos données : ellepossède
alors sonobjectif
traditionnelqui
est de discriminer au mieux les individus. Lepremier
axe
s’interprète
comme mettant en évidence deux tendances que l’on oppose selon les mêmes critèresqui
opposent les deux matériaux initiaux. Cetteinterprétation
est correcte, même si elle ne fait pas
apparaître
toutes sesimplications.
De cepoint
de vue, il est intéressant d’examiner les autres axes issus del’A.C.P. ;
c’estce que nous avons
fait,
etqui
nous aconduit,
pour toutes lesanalyses,
à identifierle deuxième axe avec les remaniements
pédologiques postérieurs
aumélange.
Ilest donc
possible
de faireapparaître quantitativement
etséparément
lesphéno-
mènes
mélange
et remaniements postmélange.
REFERENCES
[1]
CAZESP.,
TURPIN P.Y.(1961). -- Régression
sous contraintes :application
à l’estimation de la courbe
granulométrique
d’un aérosol. Revue de Statis-tique Appliquée,
Vol.XIX,
n4,
p. 23-44.[2]
LAUTRIDOU J.P.(1979). -
Granulométrie des sédiments éolienspérigla-
ciaires -
Comparaison
avec la fraction fine obtenue pargélifraction expéri-
mentale. 7e Réunion Annuelle des Sciences de la Terre.
Lyon
1979.(Livre
en
dépôt
à la SociétéGéologique
de France. p.280).
[3]
LE CALVEZ L.(1979). -
Genèse des formations limoneuses deBretagne
Centrale : essai de Modélisation. Thèse de 3ecycle.
U.E.R. des Sciences Biolo-giques.
Rennes.(213 p.)
[4]
MARTENSH.,
PAULSENF,
SPOTVOLLE.,
VOLDEN R.(1979). - Regres-
sion on
disjoint
factoranalysis
models. Secondesjournées
internationalesAnalyse
des données etInformatique.
IRIA. Versailles 1979.Revue de Statistique Appliquée, 1980, vol. XXVII I, n° 2