M ATHÉMATIQUES ET SCIENCES HUMAINES
J EAN V AN B UGGENHAUT
Questionnaires booléens : schémas d’implications et degrés de cohésion
Mathématiques et sciences humaines, tome 98 (1987), p. 9-20
<http://www.numdam.org/item?id=MSH_1987__98__9_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1987, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
QUESTIONNAIRES
BOOLEENS : SCHEMAS D’IMPLICATIONS ET DEGRES DE COHESION.JEAN VAN BUGGENHAUT.
INTRODUCTION
Afin de
généraliser
d’une manière rationnellel’analyse hiérarchique classique (
par les échelles deGuttman )
dequestionnaires booléens ,
tC.Flament
(1)
a montréqu’une approche mathématique
basée sur larecherche d’un idéal d’une
algèbre
de Boole et de sonalgèbre quotient permettait
de caractériser leprotocole
àanalyser
et d’en extraire divers schémasd’implications
dontl’interprétation socio-psychologique peut
se révéler relativement aisée.La caractérisation de l’idéal booléen du
protocole
se ramenant àune recherche
algorithmique
de"projections canoniques
ultimes"(ou PCU), l’augmentation
encapacité
et vitesse des micro- ordinateurs actuels met cette recherche à laportée
de tous etpermet d’élargir
l’éventail des
possibilités d’analyse.
Pour les
définitions,
lesalgorithmes
et letraîtement mathématique
nous renvoyons le lecteur à
l’ouvrage
de C.Flament(1).
VRIJE UNIVERSITEIT BRUSSEL
Pleinlaan,2
1050 BrusselBelgique
1. LA RECHERCHE DES PCU D’UN PROTOCOLE BOOLEEN.
Un
questionnaire
à nquestions
binairescomporte 2n patrons
deréponses possibles,
ensupposant
que lesquestions
sontordonnées,
lespatrons
deréponses peuvent
sereprésenter
de diversesfaçons
e.a. :-en associant un
couple
de lettres(a,a’); (b,b’);
... ;(n,n’)
àchaque question.
Unpatron
deréponse
sera alors constitué d’une suite ordonnée de n lettres distinctes : ab’cde’...n-en associant à
chaque question
une suite de n chiffres booléens(0,1) :
lesréponses (négatives
oupositives)
auxquestions :
10110...1-en associant à
chaque patron
le nombre entier naturel(x 2n-1)
dont la
représentation
binairecorrespond
à la suiteprécédente.
Ainsi pour un
questionnaire
à 7questions,
un mêmepatron
pourra être indifféremmentreprésenté
par(abc’d’efg)
ou(1100111)
ou par(103).
Considérons l’effectif de chacun de ces
patrons
et associons à tout entier f3 un seuil de dichotomisation :tout
patron
dont l’effectif est inférieur ouégal
à ce seuil I3 seraconsidéré comme
négligeable
et assimilé à un effectif nul.Le
protocole
sera dichotomisé par le seuil !3 en deux sous-ensembles : celui des
patrons
nonnégligeables (à
effectifsupérieur
àI3)
et celui des
patrons négligeables.
Soit
RB
l’ensemble despatrons négligeables
pour le seuil B . .Considérons un sous-ensemble de k
questions (k n)
duquestionnaire,
nousappellerons sous-patrons
delongueur
k lesdifférents
patrons
deréponses
à cesous-questionnaire.
Observons
qu’un sous-patron
delongueur
k estcompris
dans2~n-k)
patrons
différents.A tout seuil de dichotomisation B nous associerons un ensemble de PCU
(projections canoniques ultimes)
: l’ensemble maximal desous-patrons
delongueur
minimale tels que tous lespatrons qui
lescontiennent
appartiennent
àR~ .
»Ainsi un
protocole
d’unquestionnaire
à 7questions
contiendra unePCU de
longueur
3 de la forme(abd’) lorsque
l’ensemble despatrons négligeables R 4
contient les24=16 patrons
dont(abd’)
est unsous-patron.
Cette
propriété
n’est pas suffisante pour caractériser les PCU d’unprotocole
dichotomisé. Il faudra deplus
que lalongueur
dusous-patron
soit minimale et que l’ensembleR B puisse
êtreengendré
par l’ensembledes PCU.
2. I1~IPLICATIONS ASSOCIEES A UNE PCU.
La détermination des PCU d’un
protocole
dichotomisé vapermettre
de construire des schémasd’implications
entre lesréponses.
Les
implications
associéesdépendront
fortement de lalongueur
de laPCU examinée:
k=l : une PCU de
longueur
un affirme l’inexistence d’uneréponse
donnée à une
question
donnée.Ainsi la PCU " a’ " affirme que la
réponse négative
à lapremière question
est entièrement contenue dansRB
etn’apparaît donc jamais
dans l’ensemble desréponses
nonnégligeables.
Lapremière question
recevra donctoujours
uneréponse positive.
k=2. une PCU de
longueur
deux affirme uneimplication
directeentre les
réponses à
deuxquestions.
Ainsi la PCU " bc’ " affirme que le
couple
deréponses
"ouià la seconde
question"
et "non à la troisième" est entièrement contenu dansRa
etn’apparaît jamais
dansl’ensemble des
réponses non-négligeables.
Il en découle les
implications logiques :
b -; c
("oui
à la seconde"implique
"oui à latroisième")
et c’ -# b’
("non
à la troisième"implique
"non à laseconde")
D’une manière
analogue, plus
brièvement(*) :
k=3. La PCU "cd’f" détermine les six
implications :
c ^ d’ --~ f’
("oui
à la troisième" et "non à laquatrième"
impliquent
"non à lasixième")
("oui
à la troisième"implique
"oui à laquatrième"
ou "non à lasixième")
k=4. La PCU " abc’d " détermine les 14
implications :
(*)
Lesopérateurs
booléens seront notés A et v(notés
par ailleurs aussi . et+)
etcorrespondent
aux relationslogiques
"et" et "ou"(
"ou" non exclusif =
"et/ou")
Par souci de
clarté,
mais d’une manièreredondante,
nous écrironsgénéralement
toutes lesimplications
résultant d’une PCU(
les unesétant les
implications
duales desautres).
Il va de
soi,
d’unpoint
de vuepurement pratique,
que lesimplications
découlant d’une PCUperdent
laplus grande partie
de leur intérêt dès que lalongueur
de la PCU atteint 3 ou 4.L’analyse
desimplications socio-psychologiques
d’unquestionnaire
par la recherche des PCU de
longueur k
3(ou même 2)
semble être l’élémentpratique
leplus
immédiatement utilisable de cette méthode.3.SEUILS DE DICHOTOMISATION ET COHESION D’UN PROTOCOLE.
En examinant les effectifs des différents
patrons
deréponses
à unquestionnaire
et en lesordonnant,
onpeut
obtenir une suite strictement croissante d’effectifs:Chacun de ces effectifs
Si pouvant
servir de seuil dedichotomisation,
nous aboutissons à manalyses
différentes duprotocole
examiné.A
chaque
seuil de dichotomisationSi
nous associerons le nombreNi
total du nombre de
réponses appartenant
auxpatrons non-négligés
et laproportion Pi
deréponses non-négligées
par la dichotomisation:Le passage d’un seuil
Si
1 à un seuilsupérieur S.
J(Si (
1S.)
Jaugmentera
le nombre depatrons négligés
parl’analyse
etpeut
ainsidiminuer le nombre ou la
longueur
des PCU.Le
problème
du choixoptimal
d’un seuil de dichotomisation reposesur deux critères contradictoires:
-respecter
au maximum la totalité duprotocole
et doncnégliger
lemoins
possible
depatrons
à effectif non-nuls(
choisirS. i
leplus petit
possible).
-obtenir des
implications socio-psychologiques
intéressantes et donc obtenir des PCU delongueur
minimale(
choisirSi
leplus grand possible).
Il n’est pas
possible
de fournir uneréponse mathématiquement
satisfaisante à ce
problème
mais il nous a semblé intéressant d’associer à toutprotocole
une mesure dudegré
de cohésion de celui-ci:soit
Si
leplus petit
seuil de dichotomisation pourlequel
tous lesPCU sont de
longueur k ( 2,
nousappellerons degré
de cohésion duprotocole
laproportion Pi
deréponses
retenues par cettedichotomisation.
D’une manière
analogue,
le seuil minimal de dichotomisation S.J déterminant des PCU de
longueur
k 3permettrait
de définir undegré complémentaire
de cohésionP.
J( P.j
JP. )
1 ...En d’autres
termes,
il serapossible d’établir,
pour uneproportion
P. ( resp. P. )
de lapopulation interrogée,
un schémad’implications
i J
logiques
entre lesquestions (
resp. entrequestions
etpaires
dequestions ). (*)
L’association de ces seuils à la méthode de recherche des PCU
permet
d’établir des schémasd’implications
au sein d’un groupe cohérent deréponses
etremplace avantageusement
la méthodeclassique
du"croisement" des
questions
deux-à-deux(les
différents groupes depopulation
retenus par divers croisements étantpratiquement incomparables
alors que les PCU concernent unmême
groupe depopulation).
(*)
L’existence et la valeurintrinsèque
desdegrés
de cohésion d’unprotocole
n’ont pas été abordées mais mériteraient une étudemathématique plus approfondie.
4. ANALYSE DE DEUX EXEMPLES: LE PAPE ET LA RELIGION
(1?81).
Pour illustrer
l’apport
de la méthode dansl’analyse
dequestionnaires,
nous avons tiré
sept questions équivalentes
de deuxenquêtes
effectuéesà l’occasion de la visite du
Pape
enBelgique
en mars-avril 1985(enquètes
Le Vif- Di Marso(3)
et Panorama- Edit(4).
Il est utile designaler
que la secondeenquête
se limite à lapartie néerlandophone pays ).
Chacune de ces
enquêtes reprenait,
à la formulationprès,
lesquestions
suivantes:a: la visite du
Pape
influencera-t-elle la viepolitique belge ?
b: faut-il suivre les messages du
Pape
ou del’Eglise
sur laparticipation
des femmes dans les fonctionsecclésiastiques ?
c: faut-il suivre les messages du
Pape
ou del’Eglise
sur lacontraception ?
d: faut-il suivre les messages du
Pape
ou del’Eglise
sur lemariage?
e: faut-il suivre les messages du
Pape
ou del’Eglise
en matièred’avortement ?
f: faut-il suivre les messages du
Pape
ou del’Eglise
sur lasexualité ?
g:
selon vous lePape
est-ilprogressiste (
ouconservateur ) ?
Parmi les
réponses exprimées ( respectivement
environ 1500 et 1000personnes
interrogées ) respectivement
874 et 403 personnes ont formulées uneopinion
sur chacune de cesquestions.
La
première enquête
détermine 23 seuils de dichotomisationpossibles (ou
effectifs depatrons):
1,2,3,4,5,6,7,8,9,10,11,14,15,16,18,19,24,28,36,72,97,153,156
tandis que la seconde détermine 18 seuils:
1,2,3,4,5,6,7,8,10,11,13,14,18,19,28,30,34,43
Une recherche
systématique
des PCU pourchaque
seuil dedichotomisation
S. (suivant
parexemple
les valeurs décroissantes deS.)
i i
détermine très
rapidement (en quelques
minutes sur un micro-ordinateur 16bits)
les seuilscorrespondants
aux PCU delongueur
auplus égale
àdeux et trois. Les
proportions
deréponses
retenuescorrespondantes
etles schémas
d’implications
en découlent immédiatement.Ainsi pour la
première enquête :
seuil de cohésion
principal : (
PCU delongueur 2 ): Si -
24degré
de cohésionprincipal :
68.6 %(600 réponses
retenues sur
874)
seuil secondaire :
( PCU
delongueur
,3 ) S. =
7"J
degré
de cohésion secondaire : 82.4 % Aupremier
seuilcorrespondent
les PCU :et par
conséquent
lesimplications logiques (*) :
dont
l’interprétation socio-psychologique
est assez immédiate.(*)
nous noterons la doubleimplication
b ~ c et c - b(équivalence
de b et dec )
par uneégalité :
b = cPrès de 70 % de la
population interrogée répond
d’une manièreidentique
auxcinq questions b,c,d,e,f
et sansrapport significatif
avecles deux autres
questions.
Pour la mêmepopulation,
ces dernièresquestions s’opposent (la réponse
"oui" à l’uneimpliquant
"non" àl’autre).
Le second seuil de cohésion
détermine,
par son nombre élevé de PCU delongueur 3,
un schémad’implications
assezcomplexe
et peuinterprétable.
Le
choix,
relativementarbitraire,
d’un seuil de dichotomisationcompris
entre les deux valeurs de cohésion( 7 Si 24 ) permet
deconstruire des schémas
d’implications plus complexes
que leprécédent
ci-dessus mais valable pour une
partie plus importante
de lapopulation.
Par
exemple
pour le seuil immédiatementinférieur,
B = 19 :(population
retenue : 70.8%) :
et les
implications
duales en résultant.De
même
pour la secondeenquête :
seuil de cohésion
principal : (
PCU delongueur 2 ): Si -
10degré
de cohésionprincipal :
54.8% (221 réponses
retenues sur
403)
seuil secondaire :
( PCU
delongueur 3 ) S. =
J 6degré
de cohésion secondaire : 65.2 % Aupremier
seuilcorrespondent
les PCU :et les
implications logiques :
dont
l’interprétation socio-psychologique
est assez facile mais fort différente de celle de lapremière enquête.
Pour une bonne moitié de la
population interrogée
etrépondant négativement
auxquestions
c etf,
uneréponse négative
à laquestion
dimplique
desréponses négatives
auxquestions b,e
et g.Nous ne nous attacherons pas à rechercher les causes de ces
différences
importantes
entre les deuxenquêtes,
le passage duprotocole
aux schémas
d’implications
étant ici notre seulobjectif.
Nous nous bornerons à remarquer
qu’en
dehors des différences entre lesgraphes d’implications,
la valeur et l’écart entre les deux indices de cohésionpermettent
de comparer utilementplusieures enquêtes
dupoint
de vue de
l’homogénéité
des échantillons ou dans les cas extrèmes dupoint
de vue de la fiabilité desenquêtes (écart
entre lesdegrés
decohésion
d’enquêtes
,ou desous-enquêtes, parallèles
etcomparaison
avecla cohésion nulle
correspondant
à une distribution uniforme desréponses).
BIBLIOGRAPHIE
(1)
FLAMENTC., L’analyse
Booléenne dequestionnaire, Paris,Mouton,
1976.(2)
GUENOCHEA.,"Fonctions
booléennes sur un tableau en0/1", Colloque Analyse
des données etinformatique
Versailles 1985.
(3)
LE VIF - DI MARSOEnquête "
La visite duPape
enBelgique"
Bruxelles 1985.
(4)
PANORAMA - EDITOpiniepeiling
"Het bezoek van de Paus inBelgië "
Brussel 1985.(5)
VAN BUGGENHAUTJ.,
"Software voor booleaanseanalyse"
CMP - VUB Brussel 1986.
SOFTWARE VOOR BOOLEA~AI~1SE ANALYSE CMP - VUE Brussel 1986
Ce programme, en cours de
développement
au Centre forManpower Planning
de laVrije
UniversiteitBrussel,
estrédigé
en(GW)BASIC
sur micro-ordinateur Olivetti M24
(IBM- compatible ,
sousMS-DOS).
Provisoirement seulement
disponible
ennéerlandais,
ilcomporte également
une versioncompilée permettant
un traîtementplus rapide
des données.Les effectifs des
2n patrons
deréponses (n 11)
sont introduits manuellement ou via un fichier intermédiaire. Le programme détermine tous les seuils de dichotomisationpossibles
et calculeles PCU pour tous les seuils
supérieurs
ouégaux
au second seuil de cohésion définiplus
haut.Il compare