M ATHÉMATIQUES ET SCIENCES HUMAINES
G. T H . G UILBAUD
Bribes méthodologiques (I)
Mathématiques et sciences humaines, tome 20 (1967), p. 33-46
<http://www.numdam.org/item?id=MSH_1967__20__33_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1967, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
BRIBES METHODOLOGIQUES (I)
Avertissement G. Th. GUILBAUD
Ce
qu’on
va lire est uneconséquence
deconversations entre psychologues
etmathématiciens (conversations qui
ont eu lieu en Octobre1967
au CentreCondorcet),
Ce n’est pas un
compte-rendu:
on acherché à
extraire des propos tenus uneesquissE d’exposé,
d’où il soit facile de tirerquelques leçons mathématiques.
La
psychologie,
lasociologie,
ladémographie, l’économie
et bien d’autresdisciplines
encore, font usage de modèlesoù
un certainétat
de choses estrepré-
senté
par une distribution:les pi
peuvent
être desprobabilités, représentant par exemple
leschanc.es
d’uneréponse
iparmi
npossibles.
Cepeuvent
être aussi desproportions
d’individus d’unepopulation,
pi pour ceuxqui
se trouvent dans l’attitudecotée
i.Une telle distribution est
censée évoluer
au cours dutemps
etle passage
(transition)
d’une distributionà
une autre estfiguré
par uneappli-
cation
linéaire.
Dans ce cadre très
large (où
l’onreconnaît
les modèlesmarkoviens,
des mo-dèles
d’apprentissages,
des modèlesdémographiques,
et biend’autres)
onpeut s’intéresser
à certaines classes de distributions. Dans le cas des conversationscitées~
ils’agissait
de relations d’ordre.Par
exemple,
y on sait que laréponse numérotée
i esttoujours plus probable
que celle
qu’on numérote j.
Ou bien: la
population
des individus dansl’état
i estsupérieure
à
cellequi
se trouve dansl’état j.
Une
question posée était:
quepeut-on
dire des transitionsqui
conservent de telles relations ?La
réponse
tient en peu de mots.Mais il a paru
intéressant
de donner à la consultation un tourplus
didacti-que - et
d’allonger
lediscours,
à titred’expérience,
pour amorcer undialogue
entre,
l’enseignement
de lamathématique
et celui de cequ’on appelle quelquefois
la
méthodologie. D’où
le titre:lequel
se veutpeimice,
d’unerubrique régulière,
et
appel
aux collaborations futures.BRIBES METXODOLOG 1 QUES : ( 1 )
POUVOIR DES SIMPLEXES 1
1. ENSEMBLES ORDONNES ET NOTATIONS
SIMPLICIALES
1.1.- Une relationd’ordre, notée
comme de coutume:(b
est avanta)
b > a(1) peut
être transmise enlangage
ensembliste. C’est d’ailleurs l’un des modes de transmission d’information assez courammentutilisé! même
dans laconversation;
y on dit d’abord dequoi
on vaparler:
l’ensemblela,b/ ;
et ondit, ensuite, lequel
des deux
est l’aîné,
soit/b/.
Finalement la
donnée
de l’ensemble:en dit autant que
(1)
Remarque
1 : Bienentendu,
onpourrait
aussi biendire: / / a,b / , lai 1 -
maisil faut choisir: ici nous choisirons
toujours
la convention(2).
Remarque 2 :
L’introduction de cettetechnique
enmathématiques formalisées
semb]être due
à:
C.KURATO’4SKI,
sur la notion d’ordre dans lathéorie
des Ensembles( Fundamenta
Math.1921,
p.161 ) .
1.2.-
Onpeut généraliser:
unordre total
tel quesera
décrit
par l’ensemble d’ensembles(emboités):
(si
l’on a mis lapartie vide,
c’est seulement pour fairejoli).
1.3.- Ce n’est
guère plus
difficilequand
ils’agit
d’un ordrepartiel.
On doitsélectionner
desparties
de l’ensembledonné (et ordonné)
telles que si: ab,
alors toute
partie
contenant a doit contenir b.En d’autres termes:
a b sera
traduit
ab
(la présence
de aimplique
celle deb,
ou autrement: pas de a sansb).
Exemple:
l’ordrepartiel :
se traduira par le
schéma d’implications:
36.
On en
déduit
la liste de toutes lesparties
de l’ensemblequi respectent
ceschéma;
il est commode dedisposer
cesparties
en lattis:1.4.- Si,
dansl’exemple précédent,
onajoute quelque
liaison dans leschéma (5);
pour fixer les
idées,
disons :alors le lattis
’(6)
devient:Inversement,
si l’on enrichit(b)~
onvérifiera
que l’onappauvrit (5).
Par
exemple à partir
deon construit
1.5.- Je laisse au lecteur le
plaisir
et le soind’établir
lespropositions gé-
nérales : À
tout ordrecorrespond
un lattisSi l’ordre est
total,
on a une chat neSi l’ordre est
vide,
on a l’ensemble de toutes lesparties (simplexe abstrait)
et de
poursuivre l’étude
amusante de cettecorrespondance.
2.-
ECRITURES VECTORIELLES2.1.-
A toutepartie
d’un ensemble~a~b~c,d~e~
onpeut
fairecorrespondre
lafonction indicatrice
(dite
encorecaractéristique)
ou vecteur indicateur(ou:
indicateur,
pour lesintimes).
désigne:
Au schéma (6) correspond
le tableau :,
2.2.-
Si l’onappelle
v l’unquelconque
des indicateursprécédents, application
de l’ensemble
donné
dans l’ensemble/0,1/,
onvérifiera
que la conditioncorrespond
àv(b) v(c)
pourvu
qu’on décide
que : 0 0 1 1 et 0 1’
Remarque
1 : lespuristes,
iciécrivent
Remarque 2 :
et lesétudiants logiciens parlent
de "Tables devérité".
3.- DISTRIBUTIONS ET SIMPLEXES AFFINES
3.1.- Pour un
statisticien,
uneapplication
d’un ensembledonné (d’étiquettes)
tel que:
dans un ensemble
"numérique" (par exemple:
les entiersnaturels,
ou bien les ra-tionnels,
ou encore: lesréels)
seraconsidérée
comme une distribution. Soit:38.
ou bien :
Pour le
probabiliste,
la coutume est de normer, c’est-à-dire des’arranger
pour que la somme soitégale à l’unité (encore
que lelangage
familier n’ait pas aban-donné l’expression
"tant de chances surtante
on constate que, deplus
enplus,
même
les laïcs disent: "tant de chances surcent",
cequi
est unefaçon
denormer).
En
réalité
il faut bien ledire,
ce que les usagers ontl’intention
defaire,
c’est de confondre en une classe
d’équivalence, toutes-les
distributions homothé-tiques
entre elles: pour lestatisticien,
f et p ci-dessus diront la même chose.de
même y
les distributionsou bien
ou bien
(il
nes’agira
donc pas, àproprement parler, d’espace vectoriel,
maisd’espace projectif).
3.2.-
Une distributionnormée
sera donc uneapplication
telle que et
Si E n’a que deux
éléments,
àchaque
distribution on feracorrespondre
unpoint
P sur unsegment
Si E
possède
troiséléments a,b,c,
onfigurera
par troispoints A,B,C,
lestrois distributions de base:
Toute autre distribution p est une combinaison
linéaire
convexe(coefficients positifs
de sommeunité).
’
P est
barycentre
Pour
quatre points: tétraèdr,
et au delà: ce quePoincaré appelait tétraèdre généraliser
et que l’onappelle aujourd’hui simplexe géométrique (ou affine,
pourêtre
plus précis).
3.3.- Reprenons
notre ensembleà
troiséléments
E =/a,b,c/
à chacune de sesparties
onpeut faire correspondre
une fonction indicatrice.Si nous
adoptons
la convention du 3.1.qui
considère commeéquivalentes
deuxdistributions
homothétiques,
on aura lafigure:
(décomposition barycentrique:
les milieux et le centre degravité où
se rencontrent lesmédianes).
Simplexe
affineimage
dusimplexe abstràit:
,(il
manque lapartie vide,
bienentendu)
Exercice: faire les dessins pour
quatre éléments.
40.
4.- STRUCTURES ET DISTRIBUTIONS
’
4.1.- Soit un ensemble
d’étiquettes E = /a~b,c,d,...~
et une distribution p. Les valeursp (a) ~ p (b) ~ p(c),
etc...(qui
sontdes réels non-négatifs)
sontappelées,
selon
l’opportunité,
despoids (ou pondérations),
desprobabilités,
ou cequ’on
voudra. Leur ordre
peut être considéré
comme une information essentielle dans le contextetraité.
Parexemple,
cepeut
êtreintéressant
de constater que:p(a) p.(>b) p(c)
etc...ou toute autre structure ordinale
qu’on
pourraimaginer.
C’est à cetterhétorique
là
que se rattache la notion de"mode",
lescaractères: unimodale bimodal,
etc...Notons alors ceci: toute structure
d’ordre,
totale oupartielle,
concernantles
p(x) désigne
unepartie
dusimplexe~
et cettepartie
est convexe.La
démonstration
est facile: si p et q sont deux distributions satisfaisant aumême système d’inégalités y
il en va de même de toute combinaisonlinéaire hp
+kq à
coefficientspositifs.
Invoquons
alors unprincipe
bien connu de lagéométrie
affine: celuiqui
con-siste
à définir
un convexe(borné)
par despoints
extrèmes(ou sommets).
Ainsi toutes les distributions p
qui vérifient:
1et
peuvent
être obtenues en combinant les extrêmes:(combinaisons linéaires à
coefficientspositifs,
bienentendu).
4.2.-
La recherche des distributions extrêmes pour une structure d’ordredonnée,
le lecteur l’aura
déjà compris,
n’est autre que leproblème déjà traité
aux para-graphes 1.2
et 1.3 ci-dessus.Pour le cas d’un ordre
total,
c’est vraiment facile.A l’ordre total
correspond
l’ensemble des extrêmes :(scalogramme,
comme on ditparfois
ou
bien,
si l’on tientà
normer :qui
sontrespectivement
solutions deséquations :
(ci-dessus
lesystème d’inéquations (*)
auraitpeut-être
dû êtreécrit
avecplutôt
que .4.3. -
Pour le casgénéral,
on s’assurera que la recherche des extrêmesprocède
bien selon le même
atgorithme
que dans lesparagraphe
1. Pourcela,~on
noterad’abord que les extrêmes sont
obligatoirement
ou bien dessommets,
ou bien desmilieux
d’arêtes,
ou bien des centres defaces,
etc.. Nousappellerons
"centres"du
simplexe
affine lespoints
dont lespondérations
non nulles sont touteségales.
Il suffit alors de chercher
quels arrangements
dezéros
et de unsconviennent
à la structure d’ordredonnée., C’est-à-dire,
trèsexactement, quelles parties
de l’en-semble sont
compatibles
avec cetordfe:
comme on a fait en 1.3. et1.4.
ci-dessus.5~. - TRANSITONS NARKOVIENIlES
ISOTONES5.1. -
On sait que c’est A.A. Markovqui
a introduit cetype
de modèleprobabiliste:
transformation
linéaire
d’une distribution.L’aspect proprement probabiliste
sera icipassé
soussilence;
cequi
nous atta-chera,
c’est le fait deconsidérer
une transformationlinéaire
del’objet appelé
distribution.
A tout vecteur p on fait
correspondre
un vecteur q par:et T est
linéaire (c’est-à-dire sauvegarde
la structurevectorielle).
42.
Ce
qui implique:
et l’on
écrit
T sous forme matricielle:5.2.-
Toute transformationlinéaire
ne convient pas. Pour queTp
soit une distri-bution
lorsque
pl’est,
il faut et suffit que laproposition
soitvérifiée
pour lesextrêmes:
c’est-à-dire
queTB, TC,
... soient desdistributions,
cequi
revientà, exiger
que leurs
composants
soient des nombrespositifs.
Il enrésulte
que tous les termes de la matrice T doiventêtre positifs.
Si l’on
exige
enplus
la normalisation(somme
descomposantes égales à l’unité)
il en
résulte
que les somrnes des termes d’une même colonne doiventêtre égales à
l’unité.
Tout cela est bien connu.
5.3.-
Ilpeut être
utile de savoirreconnaitre, parmi
les transitions markoviennesT, quelles
sont cellesqui
conservent telle ou telle structured’ordre.
Commençons
par un cassimple (ordre total).
Supposons qu’on s’intéresse
aux distributions telles que:1
L’ensemble
de ces distributions est celui de toutes les combinaisonslinéaires possibles
desquatre extrêmes:
ou ou ou ou
Si p est une combinaison de ces
quatre vecteurs, Tp
sera lamême
combinaisonde leurs
transformés
parl’opérateur
T. -Il faut donc et
suffit,
que lesquatre
vecteurset
vérifient
la condition d’ordre(0).
Mais
on auraremarqué que TA, TB,
TC et TD sont lesquatre
colonnes de lamatrice
T.On
peut
doncexprimer
lacondition, cherchée
de lafaçon
suivante:1)
Ecrire la matrice T:(TA, TB, TC, TD) 2) Faire
les sommes de colonnes(TÀ+TB+TC+TD, TB+TC+TD, TC+TD, TD)
3) vérifier
quechaque
colonne est monotone selon la condition(0).
5.4.-
Le critèretrouvé
fournit unerègle
deconstruction,
que nousdécrivons
aumoyen d’un
exemple numérique.
On va choisir successivement les vecteurs-colonne
TD, puis TC, puis TB,
enfin
TA.
Nous normerons sur cent.
Prenons
qui
est bienmonotone y
comme il faut.Il faut maintenant choisir une seconde colonne
TC, qui
n’a pas besoind’être
monotonie,
pourvu que la somme TC + TD le soit. Parexemple
donne
et par
conséquent
convient.Pour TB on
peut prendre
carenfin convient encore
puisque
et que, nous avons
décidé d’interpréter
lesinégalités
au senslarge (lisons 4
au lieu de
)
(voir ~à
cesujet
la remarque 1 duparagraphe 2.2).
Ainsi la matrice
est de celles
qui
conservent la monotonie d’une distribution.44.
On
peut
serendre compte
de lafaçon
dont elle modifie une distribution encalculant son effet sur
quelques
casparticuliers.
5.5. -
Onpeut présenter
lemême
calcul autrement.En
partant
de la matrice dont les colonnes sontrespectivement:
soit,
dans notreexemple numérique
c’est une matrice
qu’on peut
dire "monotone": les termes vont en croissant danschaque
colonne endescendant,
et danschaque ligne
dedroite gauche.
Pour calculer la matrice T
à partir
deM~
il suffit de retrancherchaque
colonne de la
précédente.
Cetteopération
est uneopération linéaire
onpeut
l’écrire
en forme matricielle.d’où
la formulegénérale:
où
l’on aposé:
On a aussi parce que
J’=0
5.6. -
Un autreexemple (ordre partiel).
traduction
simpliciale:
Eléments extrêmes:
L’opérateur
T doitêtre
tel queTÀ , TB , TA
+TB , TA
+ TB +TC ,
etTA
+ TB + TC + TD soient desdistributions
vérifiant
la conditionimposée (1).
Il suffit de lire les colonnes de la matrice T.Les deux
premières
colonnesTA
et TB seront choisiesarbitrairement
etindépendamment,
enrespectant (1).
Par
exemple:
TA
+ TB seraautomatiquement
du mêmetype.
On choisira TC de
façon
àréaliser
la condition(1)
pourc’est-à-dire 35 + q > r , Prenons par
exemple:
46.
(on
voit que la3ème
colonne n’a pas besoin devérifier (1):
ellepeut s’écarter
dutype
d’ordrechoisi,
et la 4ème encoredavantage).
Enfin pour la
4ème colonne,
on calcule la sommeTA
+ TB + TC + TDet
l’on
choisit TD.Comme
précédemment
rienn’empêche d’écrire
en notation matricielle la trans- formationlinéaire qui
fournit la matrice(TA~ TB, TC, ~D) à partir
de la matrice(TA, TB,
TA + TB +TC, TA
+ TB + TC +TD).
On trouvera encore une formule telle que:5.7. - Autres
exercices: la condition d’ordre est detype unimodal, soit,
parexemple :
p