S. R ÉGNIER
Sur quelques aspects mathématiques des problèmes de classification automatique
Mathématiques et sciences humaines, tome 82 (1983), p. 31-44
<http://www.numdam.org/item?id=MSH_1983__82__31_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1983, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
SUR QUELQUES ASPECTS MATHEMATIQUES
DES PROBLEMES DE CLASSIFICATION
AUTOMATIQUE *
S. REGNIER
Maison des Sciences de l’Homme, Centre de Calcul
2. ASPECT STATISTIQUE
II. 1. Deux
problèmes
de convergence.Dans la
plupart
desapplications,
l’ensemble E desobjets
à classern’est
qu’un
échantillon observé dans unepopulation
E’plus vaste,
virtuellementobservable,
et lesystème
dedescripteurs
a =(ait a2 , .
,ap) qui représente
E1 2 P
dans F est défini a
priori
sur E’ tout entierDans des cas
plus exceptionnels**
,onpeut envisager d’augmenter
le nombre pdes critères formels
et l’ensemble des
images
est virtuellement
plongé
dans un ensemble F’plus
vaste. Nous allonspréciser
etétudier le
problème
de la convergence : despartitions
centralesa) lorsque b) lorsque
* texte de Nov 66 non
publié.
Suite de l’article paru dans ICC, 1965.** Exemple :
nobjets
sont classés par p examinateurs a , travaillantséparément
selon des critères propres à chacun, et extraits au
hasard
d’une vastepopulation
d’examinateurspossibles.
Voir Réf. (3).a)
Les p critèresah :
: E - F Pdéfinissent,
on l’a vu, autant departitions 5 ,
a)
Les p critèresh E -+
F
p
définissent,
on l’a vu, autant dEpartiti-ons
h et lespartitions
centrales X sont cellesqui
miniminisent la fonction( D =
cardinal de la différencesymétrique ).
Nous supposerons que les sh sont des éléments aléatoires
indépendants,
de mêmeloi L sur P
(E) =
ensemble despartitions
de E(fini).
Ils définissent une loi deprobabilité empirique
L et les variablesaléatoires:
n 1
L P (x) = Proportion
deconvergent
presque sorement(et
même presquecomplétement sûrement)
versL
(x) = Probabilité [ s = x ]
pour tout h .Par suite :
fonction continue des variables
L
D(y)
converge presque sûrement vers 1
On définit naturellement les
partitions
centrales de touterépartition
L surP(E)
comme celles
qui
rendentH(x) minima,
et 1e centre comma l’ensemble~on vide
puisque
E est fini.Les centres C des lois L sont définis de la même
façon.
allonsdémontrer
QueP P
b) Supposons
inversement que lesobjets
à classer1
soient une famille de n éléments aléatoires
indépendants
de mdme loi LI dans unensemble E’ éventuellement infini.
Pour étudier la convergence des
partitions
centrales de Equand
n tendvers
l’infini,
nous allons lesreprésenter
par despartitions
de l’ensemble fixe desimages
virtuellesLa
représentation générale :
sera
supposé mesurable,
pour la loi L’ et la mesure triviale deF.
On a vu en1.6
que
chaque partition
centrale de E estcompatible
avec a et définit de ce faitune
partition
X’ 1 de l’ensemble des"images
réelles" : a(E)
eF.
Onpeut
associer à X’ toutes les
partitions
X de Fqui
ont même restriction sur a(E)p
et la matrice bcolèenne de X
si f et g sont dans la m6me classe sinon
devra rendre minima la fonction
numérique positive
pour minimiser la somme :
en
désignant
par :-
nf ,
le nombred’objets 0. ayant
f pourimage
-
5 h ,
la matrice de lapartition canonique
de F définie par laprojection :
- et 5 la matrice de similarité
(les
p h
sont despoids
de somme 1 associés aux espaces facteursF h ).
Ainsi sont définies les
partitions
centrales de F = ensemble desimages
virtuellesrelativement à la
pondEration nf définie
parMaintenant
lesimages
f.
= a(0.)
sont des éléments aléatoires de F(fini), indépendants
et de1 a.
méme loi L =
image
de LI par a(
pour tout fpris
dans FElles définissent sur F une loi de
probabilité empirique :
qui
converge presque sorement vers L(f) quand
n tend versl’infini.
..
étant fonction continue des variables L
(f)
converge presque sûrement vers nfonction
positive
définie sur P
(F),comme H .
n
Soient alors c et C les ensembles où H et H
atteignent
leur borneinférieure,;
n n
1 .
C
= idem enH.
Ils sont nonvides puisque
P(F)
est finif1 n
A tout élément de c
correspond
unepartition
centrale del’échantillon E.
Parn
définition,
tout Xpris
dans C constituera de méme unepartition
centrale de F relativement à la loiimage
L(f),
et X estl’image
par ad’une partition
X’ de
E’ :
les X’- classes dons E’ seront lesimages réciproques
par a desX- classes dans
F.
Ainsi sont définies les
partitions
centralesd’un
ensemble E’éventuellement infini,
muni d’uneprobabilité
L’ et de pdescriptions mesurables,
à valeursdans des espaces
Fh
finis - elles-mémes munies au besoin depoids ph
de somme1.
Les
correspondances employées
sont utilement résumées par le tableau suivant:étant donné
l’ ensemble des partitions de F
soit ..
contient
l’ensemble
des compa. tibles
avec aauquelles correspond
defaçon biunivoque
1’ensemble des partitions
de a(E) ~ F . qui
estl’image
del’ensemble
despûrtitions
de F , , ,pour
l’opérateur
de restriction de F à e(E)
injection connonique d’inclusion
bijection
!eurjection
définiepar la restriction
Ici nous montrerons seulement que,
quand
n 2013~ oo 1II.2 Centre
et valeurs centralesd’ordre
md’une
loi deprobabilité
L surun espace
métrique
X_
Le
problème a j
mérite d’Otreposé
dans le cadregénéral
suivant :Considérons un espace de
probabilité (X B, L)
munid’une
distance d(x,y)
telle que les
applications
y~ d(x,y) de X
dans R soient mesurables pour toutx dans X
(telle,
autrementdit,
que toutes les boules soientmesurables)
On
peut définir
avec FRECHET[1], V m
>0,
9 )
lemB
momentabsolu
parrapport
aupoint x E X
Nous supposerons H
(x) partout
fini(*).
b
)le
centre d’ordre mquand
C n’ est pasvide,
seséléments s’appelleront
valeurs centralesd’ordre
m.Exemples
1- est
fini,
oucompact
pour lamétrique d,
C est nonvide.
2-
5i Lest
vectoriel surR,et
si lamétrique
estEuclidienne. L’unique
valeur centrale d’ordre 2 est constituée par
l’espérance mathématique :
en vertu de
l’identité
de KOENIG :Problême de
Considérons
unéchantillon
de la loi L :p variables
indépendantes X; El,
de loicelles
définissent une loiempirique
1
sur et par
suite,
desmoments t
ri w
(*) Sinon l’inégalité triangulaire permet
de voir que H(X)
estpartout
infini .et un
centre
C p où H p atteint borne inférieure.Hp
(x)
est la moyenne des p varia- blesd (x,
X.), indépendantes
de m@meloi.
Parsuite,quand
p _ H P(x)
1 p
converge presque sûrement vers
l’espérance mathématique
finieNous allons en déduire
que quznd
p ---. Co )pour X dénombrable :
II. 3
Centresd’une suite convergente
defonctions.
Appellans
centre de toute fonctionnumérique : H : X
-· R l’ensemble C éventuellement vide où H atteint sa borneinférieure.
Si une suite de fonctions
H P
tend vers H enchaque point
deX,
on voit facilement que :En effet si H
(x)
> H(y),
pour p assezgrand,
H(x)
> H(y),
et la suiteP P
des C
P
qui
contiennent x nepeut
étreinfinie, d’où :
x ~
lim sup C . Si x fini la suite des Cqui
contiennent au moins 1P - P
x ~
C estégalement finie.
Ces 2 résultats sont les seules
propriétés générales
dans le domaine des fonctionscertaines,
comme le montrent lescontre-exemples
suivants : x = les rationnelscompris
entre 0 et 1on voit aussi facilement que la suite C P
n’est pas en
général convergente,
etpeut
méme étre
quelconque: t )
étant donnée on notera B les fonctions indicatricesP ~
Pet on posera : H
(x) = - -
B(x),
parexemple.
P P P
Fonctions aléatoires à limite certaine Si les fonctions H
P
sont
aléatoires,
la limite H restant une fonction certai- ne, on a d’abord un résultatindépendant
du cardinalEn effet
alors
par suite
2)
x E lim sup csignifie :
la suite des cqui
contiennent x estP P
infinie,
soit :et entraine :
maintenant les événements
forment une suite
décroissante :
si bien que :Dans le cas
particulier
oùil résulte de
(1)
que :et ces deux
probabilités
tendent vers 0 siH ~ H presque
sorement.
p Par
conséquent
pour le
point
ychcisi ,
et à fortiori- De ce lemme résulte immédiatement :
1)
Si H ---~ H enprobabilité
et X finiD -
2)
Si H --i H presque sûrement et X dénombrableP -
En effet dans
1)
l’événementcomplémentaire s’écrit :
et lton a vu que ces
probabilités
tendent vers 0Dans
2)
l’événementcomplémentaire
s’écrit :et l’on a vu que toutes ces
probabilités
sont nulles .Les deux restrictions sur le cardinal d8 X sont
indispens3bles.
En effet :1)
Enreprenant
le1er contre-exemple ci-dessus,
oùX,
dénombrable = les ration- nels de10,11
2)
Soit U une variablerépartie
uniformément surl’ ensemble = [0,1]continu .
La fonction
et presque
sûrement égale L
On a elors
quelque
soit pet par suite
II.
4 Inclusionréciproque
du centre d’une loi L.Dans le cas des moments aléatoires d’une loi
empirique
variables
X,
dans X va entrainer presque sorement l’inclusionréciproque :
Le centre C étant ici
fini,
il suffit d’établir que pour tout x E CCette dernière
probabilité,
étant non-décroissante doit être constammentégale à
1.C’est dire que l’événement
complémentaire :
doit étre presque
impossible.
C’est une sommE de variables
mutuellements
indépendantes
et de ngmnloi,bornées
par:E = ~~ax
d m (x, X) ,
borne finiepuisque X
est finiLes moyennes scnt :
Les moments du second ordre :
sont
également
finis si bien que les variances et covaricnces vont former une matrice1%
finieEn vertu du théorème central
limite,
le vecteur 5 pde défini par les variables P
S (y)
suieesymptctiquement
une loi normale : PL’êvénement BX signifie
n
Considérons
alors une sous-suite infinie arbitraire s nLes vecteurs :
sont somme dei vecteurs
D, indépendants,
et sont1
mutuellement
indépendants.
~X entraîne
n
Les
événements
ssont mutuellement
indépendants;
par suite :Pour certaines suites
pk ,
ceproduit
infini va Otre nul. Il suffit queor :
si
vk
---. co le loi limite du vecteurles second membres ont pour limites :
Par suite
cette
probabilité
est engénéral positive,
etExceptionnellement
limpresque
sûrement,
parsuite :
La loi L serait
concentrée
dans " l’axemédiateur
" du centre c. AlorsH P (y)
= constante pour y E C.Quand CP coupe-
c, Commecp
est non vide :Tout se passe comme si C
était réduit à
un seulpoint.
Remarque EP = Pr 1 peut
tendre vers 0 : ’Prenons
une loi L uniforme sur un ensembleà
2éléments: ! = 1 x,~
Dans cet
exemple :
lim supcp =
C etlim inf
cp = 0
presquesûrement.
Références :
[1]
FRECHET M.,Généralités
surles probabilités. Variables aléatoires,
chapitre
III, dans le § "Valeurstypiques
d’ordrepositif", p.89,
in
Traité du calcul des probabilités
etde
sesapplications
par E. Borel.tome I, les
principes
de la théorie desprobabilités.
Fascicule III.Premier livre., Paris,
Gauthier-Villars,
1950.[2] (1) "Les
éléments aléatoires de naturequelconque
dans un espacedistancié",
Annales de l’Institut Henri Poincaré,
vol.XIV, 1948,pp.
215-310.(2) "L’intégrale
abstraited’une
fonction abstraited’une variable abstraite
et son
application
à la moyenned’un
élément aléatoire de naturequelconque",
Revue
Scientifique, 82e année, 1944,
pp. 483-512.[3] "Positions typiques d’un
élémentaléatoire
de naturequelconque",
Ann. Ec.Norm.