M
C LAUDE F LAMENT
L’analyse booléenne de questionnaires
Mathématiques et sciences humaines, tome 12 (1965), p. 3-10
<http://www.numdam.org/item?id=MSH_1965__12__3_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1965, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’ANALYSE BOOLEENNE DE QUESTIONNAIRES
Claude FLAMENT
Cet article
fait appel
à un certain nombre de notions sur lesAlgèbres
deBoole
finies
etles -SimPlexes.
Pour lesdéfinitions
des termesqui
ne sontpas familiers
aulecteur, celui-ci pourra consulter :
-
Simplexe, Algèbre simpliciale :
P.ROSENSTLFHL, M.S.H.
N° 9;-
Algèbres
deBoole, Algèbres
de Boole libres: JI.EYTAN, M.S.H. ».-51-44-
-
Morphismes, idéaux, quotients:
MarcBARBUT,
M.S.H. N° 1:2(le présent numéro), P
Dans le but
d’organiser
etd’interpréter
unprotocole
depassation
de ques- tionnaire(d’attitudes, d’opinions, ...),
on recourt souvent àl’analyse
hiérar-chique qui
tend à faireapparaître
uneéchelle
de Guttman(cf. MATALON, 1965):
on sait du reste que cette
méthode
nes’applique
pasqu’aux questionnaires,
commel’a
montré,
parexemple,
V. ELISSEEF(1965)
en étudiant les bronzes chinois ar-chaïques.
’
Cependant,
il estexceptionnel,
yqu’on trouve,
y dans desdonnées
d’observa-tion,
une échelle de Guttmanparfaite,
oumême
valablementapproximative. D’où,
la recherche
d’analyses plus générales
que celle de Guttmano Coombs et Kao(cf.
COOMBS, 1964, chap. 12)
ontproposé
unegénéralisation
multidimentionnelle del’analyse hiérarchique,
y que MkTALON(1965, chap. 7)
aalgébrisée, et
que nousavons encore
généralisée
par cequ’on peut appeler
les "modèles de fermeture"(FLAMENTy 1965).
Ces travaux utilisentl’algèbre simpliciale
sur lesparties de,,
l’ensemble desquestions (si chaque question
necomporte
que deuxréponses,
ex-clusives et
exhaustives);
cequi correspond
à l’une desprésentations possibles
des échelles de Guttman
(considérées
commechaînes
maximales d’inclusion sur lesimplexe).
Mais il existe au moins une autreprésentation
des échelles de Gutt-man, et donc sans
doute,
une autre voie degénéralisation.
Ils’agit
d’unepré-
sentation utilisant la notion
d’implication, qui
nous conduira àl’analyse
boo-léenne
- dequestionnaire.
*
* *
,
Laboratoire
dePsychologie
Sociale, Aix en Provence.Soit un
questionnaire
dontchaque question X
admet deuxréponses, x
etx’ ,
yexclusives et exhaustives
(un
individuinterrogé
donne uneréponse
et une seule àà
chaque question). Soit R
l’ensemble desatrons
Ppossibles,
ou suites de ré- ponsesqu’un
individupeut donner;
parexemple,
si on a 3questions A, B, C,
(a b c’)
est unpatron P de
R.- - -
A
partir
d’unprotocole
depassation,
nousdéfinissons
l’ensemble~1
des pa-trons
représentés, c’est-à-dire, donnés
chacun par au moins un membre de la popu- lationinterrogée ; R ~ complémentaire
de~1:
parrapport à R,
est l’ensemble despatrons non re résentés.
’
Si,
pour notrequestionnaire (A, B ~ C ) ~
nous obtenons:avec :
nous disons que
R~ constitue une
échelle de Guttman. On saitalors (cf. MàTALON,
1965,
p.42)
que, y si on "croise" lesquestions
deux àdeux,
y on obtienttoujours
des tableaux à 4 cases, dont l’une est
vide,
comme dans cetexemple:
On voit alors que si un individu donne la
réponse a,
celaimplique qu’il
donne aussi la
réponse b (s’il
donnaitb’, ayant donné a,
la case(a b’)
ne se-rait pas
vide).
Ce que noussymboliserons
par :- --
(on
remarque que(a-b)
estéquivalent
à(b 1 ---*. a 1 ) ) .
Ce genre
d°analyse
conduit àexprimer
l’échelle de Guttman que nous avonsobservée
par leschéma d°implication:
ou, y de
façon équivalente :
Dans ces
schémas,
y il est inutile deporter (a.-~c)
ou(~_’20132013~j~)? puisque
implication
est une relation transitive.Supposons
maintenant que nous ayons 4questions A, B~ ~ D~
et que lPs pa-trons
représentés
constituent l’ensembleRi
"-i suivant :Un tel
protocole
nepeut
pas se résumerparfaitement
par uneéchelle
de Guttman - mais rien ne nousempêche
deconsidérer
les 6 "tableaux croisés"etc...,
y et d’en déduire unschéma d’implication;
on trouve le schéma sui- vant :le tableau
(B X C)
necomporte
aucune casevide,
d’où l’absence de flèche entreb-
et c.- -
On
peut
considérer ceschéma d’implication
comme résumant leprotocole
d’ob-servation,
mais il faut remarquer quece résumé n’est
pasunivoque;
; eneffet,
sinous
supprimons
lepatron P2
ou lepatron §,
ou les deux à lafois,
y on constatequ’on
obtienttoujours
lemême
schémad’implication. D’où,
deuxproblèmes : 1)
Comment trouver la classe desprotocoles qui
admettent unmême schéma d’implication ;
2)
Commentgénéraliser
cetteanalyse d’implication
de telle sortequ’il
y aitcorrespondance biunivoque
entre l’ensemble desprotocoles
et l’ensemble desschémas.
Quelque
soitl’intérêt
dupremier problème,
nous ne traiterons ici que du second.L’idée
est deconsidérer,
non seulement le croisement desquestions
deuxà
deux,
mais aussi trois àtrois, quatre
àquatre, etc..,
et de trouver des im-plications
non seulement entre deuxréponses,
mais aussi entre deux groupes deréponses. Ainsi,
y on montre que, si dansl’exemple précédent
onsupprime P2’
leprotocole
admet pour résuméunivoque
le schéma suivant : .Il semble commode de
présenter
cettegénéralisation
dans le cadre de l’al-gèbre
de Boole librequ’on peut
construire sur lequestionnaire étudié.
*
Soit donc im
questionnaire rrJùip>r».a,n+>
nquestions xj (i
"1, 2~
....n):
gchaque question Xi.
admet deuxx
de telle sorte que tout il- dividuinterrogé
donne soi.t x1_, soitxli"
iiiPour
chaque que 5 t i ()n, choisissons réponse;
pour d(-,-,modités
chois Lssons les~~
et considérons 1Q-~x~ î- 1 2
...,
ii
f i desalgèbre
de BooLe libre correb-po ndant
q i,i v; ,; «é v ud- 1 é .
’! 1Hl
tprmp xi
i "doîiji(-v Jaréponse
lecO_C1j ugué
de-
est sanégation:
pas doifiiet.x" ,
"donner laréponse XI
11 opéra-tîon
sti-p1,1)
31" ! r a,Ou (x1
vx :
"doRner laréponse x. ,
ou J Et.réponse
ou lés dr-iix à, la et
le opéraf ion
inf(A)
se lira ET(xl A;
"donner à, la fois -];.x.
et ml.x." ) ,
Lep 1 p supérieur
° ’ Vpeut
être considéré commesignifiant
° ’ 1 a"configiix.a,"t,1,nn (de réponses) uriiverselle", puisque
Vx’
vx! .,
cequi
est tou-jours
le cas, lesréponses
étantexhaustives;
et lepôle inférieur A,
la "confi-guration absurde", puisque A 2LI. 2L’i,
cequi
nepeut jamais
seprésenter
con-crètemenfi,
losréponses
étant exclusives.Noton- qii,,
qui
1 s’écrivent à seuLement des ngéné- rateiLrs,
delWopération
et de la,(/), corresponden’t
auxpatrons
de
réponses
cnnsti"Lua,ni, ,l ’pnsemble R définiprécédemment.
Nousappellerons
doncces
terme s dga ; patron s
y etdpsignerons
parP,.
Nousappenerons sous-patrons
2. un élément deQ
écrit à d 1 u-ri-eparti3:?
seulement desgénérateurs,
de1
opération
et de la,conjugaison. Ainsi, si n :-: 3,
y(2L A x’2
1B 1-1npatron,
y et(LI
Ax’2)
unsous-patron.
Si,
e à unepopulation
idonnpp,
e nous posons 1 Pquestionnaire
> àpartir
11(BI]S avons construit
algèbre Qy
nous comme en lli, B ur ensem-ble
R
depatrons
Pt iin Pnsc,,mbte,R
dppa.trons ’1"
partir
de i 1 t,définir une i ion
j -
sur Q ;
"
~ ’ ’ ’ ~ ’~
si a est
iin’
élément de2.,
~~~ ~~Y~
~ 1signifie
qLxFt r1 [,1) .= 0,
i finH 1. .
.
Etaii-t> 1 tpri.;emb.le
R
dis non nous défirlissol1Sr
par les -. ,
0 si. le
patron
P est nonreprésenté
Lent à,~);
3 - (~
(~ t ,~)
étant, d , s de4 si 1 nn a de
2.
pasdéclara
non partion des
règles peéeédentes,
alors il estreprésenté:
r(o)
,On
peut
se demander sir
n’est pas unépimorphisme de.2
sur l’ensomblpf OY 1 1 considéré
comme unealgèbre
deBoole;
il n’en estrien,
comme le mon-trent les tableaux suivants:
Les valeurs de
r portées
dans les colonnes de droite de ces tableaux se dé- montrent assez facilement àpartir
desrègles
de construction de la fonctionr.
Les
points d’interrogation
nesignifient
pas que les valeurs der (a A ~) et
de
r ( a’ )
sontindéterminées:
elles nepeuvent
sedéduire
desvaleurs de r ( a)
et
r (P)y
maisseulement,
se construire par lesrègles définissant r; et, sui-
vant les cas, on
peut
obtenirsoit 1,
soit 0. Ceci suffit à montrer que r n’est pas unépimorphisme,
etsuggère,
y parailleurs,
une certainedissymétrie (parfois gênante)
entre les deuxopérations sup
etinf,
tout comme entre les deux valeurs der.
Quoiqu’il
ensoit,
nous pouvons considérer l’ensembleQD
des éléments nonreprésentés de £ :
On voit alors que:
Qo
est un idéal deQ.
En
effet,
un idéal Ide Q
est unepartie
deQ
telle que:A
partir
de la définition deQo,
desrègles
de construction de la fonctionr
et des tableaux donnésci-dessus,
onvérifie
aisèment que2D
a bien ces troispropriétés.
j~
étantfini,
y on saitqu’il
existe unélément unique Él
de2.0 qui absorbe,
pourl’opération sup,
tous leséléments
de2,.0; E
est lesup de
tousles
éléments
et ladonnée de S
suffit à définirentièrement ~o .
On voit alors facilement
qu’à chaque protocole
d’observation(défini
parRi
etcorrespond
unélément t unique (qui
se calcule comme le sup des pa-trdns non,représentés)
etqu’à chaque élément de ~ (autre
que lepôle supérieur V) correspond
unprotocole unique.
Nous avons unecorrespondance bi-univoque entre £
et l’ensemble desprotocoles.
En d’autres
termes, 8 résume entiérement,
et defaçon univoque,
tout cequ-us intéresse
dans les résultats de lapassation
de notrequestionnaire.
4
On
définit
sur unealgèbre
deBoole,
une relationd’ implication (ou sorbtion) :
On
démontre qu’il s’agit
d’une relationd’ordre,
et par ailleurs que :~ , - , B.. , , , - , A. 1
Nous allons utiliser cette relation dans une nouvelle
algèbre
deBoole,
g£o ,
e définie commel’algèbre quotient de .2
par l’,idéal2.0.
Cettealgèbre
estgénéralement
nonlibre ;
elle estisomorphe
ausimplexe
desparties
de l’ensemble~1
despatrons représentés.
Onpeut l’écrire
en conservant lesgénérateurs de 2.
et en introduisant entre eux les liaisons
nécessaires.
Pour cefaire,
y il suffit de poser6
y le deQ~ dans Q, égal
à/~ ,
lepôle inférieur
de~/Sp ’
Or,
on sait que toutélément
d’unealgèbre
de Boolepeut s’écrire
canoni...--quement
sous la forme d’unp
d’unepartie
deséléments
que nous avons qua-lifiés de sous patrons (ou
depatrons) (n’utilisant
que lesgénérateurs,
y et lesopérations
inf et deconjugaison).
Donc, si B
faitpartie
de l’écriturede ~ , comme 6
etdonc c’--.A,
on
peut écrire £ 2013-A ;
etsi £
= onpeut écrire:
, ou encore :
Si on
procède
ainsi pour tous lessous-patrons
faisantpartie
de l’écriturede E ,
, on obtient unschéma d’implication qui
est très exactement la solution de notreproblème.
Reprenons
l’un desprotocoles mentionnés
en introduction. Nous avions 4questions: A, B, C, D,
etB:.1
.~P3,
y14,
Il~ y16 1 ;
~ avec :on en déduit
R
parcomplémentarité
et on obtient:qui
se traduit par diversschémas d’implication équivalents,
dont l’un est bien celui que nous avions donne:Prenons un
exemple réel :
unepetite partie
d’uneenquête effectu¿p)
H T a.plusieurs années,
parl’I.F.O.P.~ auprès
d’unéchantillon
deplus
de 3.000 Fran-çais.
De cetteenquête,
y nous n’avons retenu que 4questions;
voici les 4généra-
teurs de
l’algèbre utilisée:
g :
:être
favorable à deGaulle ;
:
penser que lespouvoirs
du Parlement doiventêtre augmentés;
n :
penser que le niveau de vie s’est amélioré dans les dernierstemps;
s
:être syndicaliste.
On a trouvé:
il a semblé que le
schéma
leplus significatif,
àl’époque,
était:Nous laissons le lecteur
interpréter psychosociologiquement
ceschéma,
etconstruire les autres schémas
équivalents (mathématiquement),
y dont certains luiparaîtront
d’un certainintérêt.
*
* *
L’analyse booléenne
dequestionnaire
résoud bien leproblème
que nous nousposions;
mais pour que la méthode devienne utilisablepratiquement,
y d’autresproblèmes
doiventêtre
résolus. Nous en mentionneronsquelques
uns, y sans donner les solutionsplus
ou moinscomplètes
que nous leur avons trouvées.1 - Il y a
intérêt
à ceque É5
soitécrit
sous formecanonique
minimale: leplus petit
nombrepossible
de souspatrons,
chacuncomportant
leplus petit
nombrepossible
degénérateurs: sinon,
l’écriture estredondante,
et aussi le schémad’implication qui
en résulte. Parexemple,
siE - (a A b’ ) V V (a A c’ )
la forme minimale
est 8 = (a!B b’) V (b 1B ç’ );
eteffectivement,
iln’est pas
nécessaire
(ni mathématiqueme7t,
y nipsycho-sociologiquement)
de considérer la relation(a20132013~c)~ puisqu’elle
n’estqu’une conséquence,
y partransitivité
des relations
(a --~b)
et(b -c).
2 - Pour le calcul
pratique
suivant les cas, il estéconomique,
soit departir
directement despatrons,
soit deconsidérer
les tableaux croisant lesquestions
2 à2,
3 à3, etc.,
y successive.ment. Dans ce dernier cas, unalgorithme peut être
donnéqui permet
de faire un nombre minimumd’opérations matérielles,
yet conduit directement à la forme
canonique
minimalede 6 .
3 - Si certaines
questions
duquestionnaire
réelcomportent plus
de deuxrépon-
ses,
l’analyse booléenne
esttoujours praticable,
à condition deremplacer
chaque question ayant plus
de deuxréponses
parplusieurs questions n’ayant
que deuxréponses,
comme dansl’exemple, où A (ayant
3É~3)
estremplacé par X
et Y:La case vide se traduit très naturellement dans notre lan- gage par
(~’ --.~);
dans leschéma
d’implication,
onpourra traduire
~)
parpar
(a1 ou 13),
etc...4 - La
principale
difficulté pourl’usage pratique
del’analyse booléenne
dequestionnaire (comme
pour touteanalyse algébrique
dequestionnaire)
vient de lanécessité,
trèsgénéralement
reconnue, d’avoir uneapproximation statistique
desrésultats;
nous avons(Flament, 1965 a) proposé
une voiegénérale
pour ce genrede
problème,
mais sonapplication
ici sembledélicate.
5 - On l’aura
remarqué, l’analyse
booléenne dequestionnaire
estapplicable
àtous les
protocoles
d’observationpossibles.
Une telle méthode universelle estsans doute un bon cadre pour l’étude
mathématique
de laplupart
desproblèmes d’analyse algébrique
dequestionnaire,
mais onpeut
aussi souhaiter unespéci-
fication
de.s
résultatspermettant
de retrouver les modèlesclassiques.
Parexemple,
on démontrequ’on
a une échelle deGuttman,
si et seulement si onpeut
réindicier
les générateurs
selon un certain ordre(la hiérarchie guttmanienne),
de telle sorte que: . Il con-
vient de rechercher ainsi les
types de É correspondant
aux divers modèles clas-siques,
y et aussi de voir si diverstypes de 6 particuliers
ne donnent pas nais-sance à de nouveaux modèles
(par exemple, spi 8
est l’inf dedivers 1J 1 guttma-
niens,
on obtient une division de lapopulation
enclasses latentes,
chacunecaractérisée
par une échelle de C uttmandifférente).
Brl Bl 1 OGRAPH 1 E
COOMBS, C.H. , 1964, A theory of data,
NewYork, Wiley.
ELISSEEF, V., 1965, Possibilités
duscalogramme
dans l’étude des bronzes chinoisarchaïques,
Math. Sc.Hum., 11,
1-10.FLAMENT, C. , 1965,
Introduction aux modèles de fermeture enanalyse algébrique
de