M ATHÉMATIQUES ET SCIENCES HUMAINES
J ACQUES B ERTIN
La cartographie statistique automatique
Mathématiques et sciences humaines, tome 17 (1966), p. 71-76
<http://www.numdam.org/item?id=MSH_1966__17__71_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1966, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LA CARTOGRAPHIE STATISTIQUE AUTOMATIQUE THE AUTOMATICAL STATISTICAL CARTOGRAPHY
Une
analyse
de lacartographie
statistique moderne mon-tre que la
grande majorité
des cartesreprésente
desquantités
par zones. Dans laplupart
des cas eneffet,
une
analyse géographique
peut être ramenée à cette dé- finition etquelle
que soit la nature de l’unitédécomptée
le
problème graphique
est semblable : ils’agit
de cons-truire un
histogramme
à trois dimensions. Mais si la transcription del’espace géographique
estaisée, quelle
forme
graphique
faut-il choisir pourreprésenter
les quan- tités ? Nous étudierons donc :1)
le choix d’une formule11)
l’automatisation de cette formule.1 - LE CHOIX D’UNE FORMULE
La
représentation
d’une série quantitative traduit la"variation de distance" entre les
catégories,
variationexprimée
par lesquantités.
Lorsque
lescatégories
sontalignées,
c’estl’histogram-
me de
répartition
des statisticiens(fig.l).
Il révèle despaliers qui
permettent de "réduire" la liste descatégo-
ries à
quelques
termes : les groupements caractérisés par de faibles "distancesquantitatives" (fig.2)
Lorsque
lescatégories
construisent unréseau,
l’histo-gramme devient un relief à trois dimensions
(fig.3) qui
doit révéler les groupes résultant non seulement des"distances
quantitatives"
mais aussi des "distancesgéographiques".
Ces groupements necorrespondent
pas nécessairement à ceux révélés parl’histogramme
et desrégions homogènes
peuvent résulter de la confusion inti-me de
catégories
situées aux deux extrémités de l’histo-gramme
(par exemple fig.9).
En
conséquence :
1 - seul un
histogramme
à troisdimensions,
un"rel ief",
peut transcrire convenablement des
quantités
par zones.An
analysis
of modern statisticalcartography
showsthot the
majority
of maps representquantities
perzones. In most cases a
geogrophicul onalysis
can bereduced to this definition and whatever the nature of the
geogrophicul
unit is, thegrophicul problem
issimilar : the solution is to draw a
histogram
in threedimensions. But if the transcription of a
geogrophical
area is easy , what
graphical
form should be chosento represente
quantities ?
Let us thenstudy : 1)
the choice of aformula, 11)
the automatisation of this for- mul o.I - THE CHOICE OF A FORMULA
The representation of a
quantitative
series shows the"distance
variation"
betweencatégories ;
thèse varia-tions are
given by
quantities. When thecategories
arealigned together
we have the statisticians’histogram
distribution
(fig.l).
It reveals levels which enable the list of categories to be reduced to a few terms : groups characterized by small"quantitative
distances"(fig. 2) .
When
categories
build up anetwork,
thehistogram
forms a three dimensional"relief"( fig. 3)
whichshould reveal the groups
resulting
notonly
from"quan.
titative
distances",
but also from"geogrophical
dis-tances". Thèse groups do not
necessarily correspond
to those shown
by
thehistogram
and somehomoge-
neous
régions
may result from the intimate confusion of categories located at the two ends of thehistogram (for
ex.fig.9).
In consequence
1 -
only
ahistogram
in threedimensions,
a "relief"can
properly
transcribe quantitiesby
zones.Fi,.5
2. comme
l’histogramme
derépartition,
le relief doit d’abordreprésenter
l’informationexhaustive (c’est.à.dire
non réduite à
quelques pal iers préconçus), après quoi,
et seulement
après,
l’observateur peutdécouvrir
lespaliers
contenus dons l’information. Lespaliers sont
lebut de la
représentation
et non le moyen, cequi
excluetoute formule comportant un choix
préalable
depaliers.
3. l’oeil doit
pouvoir dégager
de l’ensemble de la carteles zones
différentes et
t les zomessemblables,
cequi
exclue toutereprésentation
interdisant 1 a lectured’om.
semble des
potiers.
4 les différences doivent itre
quomtitotives
et mesura.bles visuellement sans l ’a140 de nombres écrits, On démontre que
parmi
toutes les formulesgraphiques possibles,
seul le semisrégulier
de cercl’I croissants(fig.4)
peut à la fois itre exhaustif et admettre la per.ception zonale,
laperception quantitative
et la lectured’ensémble.
Lalongueur
de la variation sensible estconsidirable car cette formule combine deux
perceptions
convergentes ; -. la différence de teille entre lespoints
et la différence de valeur entre les zones. Elle permet depercevoir
desquantités
absolues et des densités et2 - as the
histogrom of diltribution,th. "relief"
mustreprosomt first the exhaustive information
(this
is tosay not roduced te a fow
preconctived levels).
After which andonly after,
the observer can discover thelevels
contoined imside the information,3. the $yt should be oble to
distinçuish
frorn the mopos a whole the non
similar
zones and the bimilir ones, which excludes anyrepresentation proyentimg
therooding
of the levels es a whole.4. the difforemces rnust bu
quantitative
andvisuclly
measurable without the cid of written nurnbers.
It is dernomstroted that among ell the
possible grophi.
cal
forrnulog, only
therogulor
arrangement ofgrowing
circles can be et the sorne time exhaustive ondpermit
zomalpercwptton, quantitative perception
and arooding
of the whole.
The
longth
of moticoeble variation islarge,
becousethis formula cornbimes two
convergimg perceptions ;
-.difforence of site between circles
(dots)
and differon.ce of value between zones. It allows
perception
ofFig.
6apporte une information
originale quel
que soit le niveau de lectureadopté
par l’observateur. A ces caractères sé- mantiques il faut ajouter despropriétés
fonctionnelles : le semisrégulier
autorise lesplus
fortes réductions(microfilmage, fig,l0)
et seprête remarquablement
à l’automatisation.L’établissement de
l’échelle,
c’est à dire de la corres-pondance
entre la taille des cercles et la série statisti-que doit être très
précis.
Il estpossible
de dessiner des cerclesproportionnels
à chacune desquantités.
Mais laséparation
de deux tailles devient inutilelorsqu’elle
tombe au-dessous du seuil de sensibilité. On peut donc construire la série nécessaire et suffisante : la gamme naturelle des tailles croissantes. Elle est
universelle,
Sa
longueur
est définie par l’écart au-dessousduquel
toute taille intermédiaire devient
inutile,
et par la pro-gression géométrique qui
détermine des écarts sensiblesréguliers
et constants.Cette gamme étant fixée
(fig.5),
le calcul de l’échelle devient très aisé. Pour bénéficier de laplus grande
sé-paration visuelle,
il suffit de fairecorrespondre
les li-mites de la série quantitative avec les limites de la gamme. Les cercles intermédiaires définissent les cou-
pures statistiques que des tables de
correspondance
don-nent immédiatement.
Il - L’AUTOMATISATION DE LA CARTOGRAPHIE STATISTIQUE
Cette formule peut être dessinée à la main. Elle peut être semi-automatique
grâce
auxplanches préfabriquées
Elle peut enfin être automatisée. Notons que l’automati- sation n’a pas été le but de nos recherches mais l’abou- tissement
logique
desexpériences
qui tiennent compte- de la
généralité
duproblème
et de son économie,- des
caractéristiques
de la formulegraphique efficace,
- de la masse documentaire à
exploiter
et de larapidité
requise.Pour réaliser cette automatisation il faut
disposer
d’unordinateur,
d’un programme et d’une imprimantespéciale.
F i g , 7
obsolute quantities and of densities and
gives original
information whatever the level of
reoding adopted by
theobservers. To thèse semantical
characteristiques,
wemust add functionnal
qualities :
theregular
arrangement allowsbigger
réductions(microfilming, fig.10)
andcan be
remarkobly eusily
used with automatisation.The choice of a
scale,
that is to say the correspon- dence between the size of the circles and the statisti- col series must be very précise. It ispossible
to drawproportional
circles for each one of the quantities.But the distinction of two sizes becomes
pointless
when it falls below the threshold of
comprehensibility.
So,
we can build up the necessary and sufficient se-ries : the natural scale of
growing
sizes. It is univer- sol. Itslength
is defined by the distance below which any intermediate size becomes useless andby
the geo- metricalprogression
which déterminescomprehensible, regular
and constant distances.This scale
being fixed, (fig.5)
the calculation of the scale becomes very easy. To benefit from thebiggest
visual séparation, it is sufficient to make the limits of thequantitative
sériescorrespond
with thelimit~
ofthe scale. The intermediate circles define statistical
cuts which are given
immediatlr by
thecorrespondence
tables.Il - THE AUTOMATISATION 0F ST:WTISTICAL CAR- TOGRAPHY
This formula can be drawn
by
hand. It con be semi-au- tomatisedby using ready
mode tables. lt can even beautomatised. It should be noticed that automatisation hos not been the aim of our
research,
but the final andlogical
issue of experiment which takes into considera- tion :- the
generalitr
of theproblem
and its economy ; - the characteristics of an eff icientgraphical formula ;
- thequantity
of the documentation which is to be usedand the
speed required.
To achieve this
automatisation,
a computer, a program and aspecial
printer arerequired.
Fig.
8L’imprimante
peut être unetabulatrice,
undisque lumity-
pe, une table traçante, un écran
cathodique
ou une sim-ple
machine à écrire modifiée. Nous avons retenu cette dernière solution : unsystème
IBM 870(fig.6)
modifiéet
équipé
des signes de la gamme naturelle et d’un inter-lignage égal
à l’écartement.Il est commandé par un jeu de cartes
perforées
fourni parl’ordinateur et lu par une lectrice 836
(fig.7).
Pour four-nir ce
jeu,
l’ordinoteur est instruit de la série statistiqueet d’un programme qui contient les constantes et comman-
de les
opérations
à effectuer.Le programme contient :
a - la correspondance entre les "adresses" de l’informa- tion
(les
numéros dezones)
et les "adresses" en X et enY des points de la carte. C’est une constante pour un ré-
seau
géographique
donné.b - la correspondance entre la gamme naturelle
(constan- te)
et la série statistique,après analyse
automatique de lasérie,qui
définit l’échelle et élimine éventuellement les"queues".
Le programme permet de
plus
c - de recevoir
plusieurs
séries et d’effectuer toutesopérations :
somme, différence ou rapport de séries entre elles.d - de définir une échelle commune à
plusieurs
séries.e - de diviser les nombres par la surface des zones et
calculer la densité.
Fig. 9
The printer canbe a tabulator,a
lumitype disc,
aplotter,
a visual
display
unit, or asimple
modified type-writer.We have chosen this last solution : an I.B.M. 870 system
(fig.6)
modified andequiped
with the signs of a natural scale and of a space between two linesequal
tothe distance of dots.
It is fed
by
a set ofpunched
cardsproduced by
the com-puter and read
by
a I.B.M. 836punched
cards reader(fig.7).
To obtain this set ofpunched
cards the statistical series is fed to the computertogether
witha program which contains the constants and which control the operations to be done.
The program contains :
a) the correspondence between "locations" of the infor- mation
(the
numbers of thezones)
and the "locations"in X and in Y of the points of the map. It is constant
for a given
geographical
network.b)
thecorrespondence
between the natural scale(cons- tant)
and the statistical series, after automaticanalysis
of the series which defines the scale and eliminates if necessary "tails".
The program further enables
c)
several series to be undertaken and ail operations to be effected : sum, difference or relation of series between one another.d)
a common scale for several series to be defined.e) the numbers to be divided
by
surface of zones andf - de sortir "en clair" sur une feuille
d’accompagnement
les éléments de la
légende,
del’échelle,
des hors-éche!- les(ou "queues")
et lescaractéristiques mathématiques
de la série.
Pour
rédiger
une carte1 - on instruit l’ordinateur du programme, des séries statistiques et d’une carte
perforée
de contrôle.2 - l’ordinateur fournit un jeu de cartes
perforées
et lafeuille
d’accompagnement.
3 - ce jeu est introduit dans la "lectrice" qui commande
l’imprimante.
L’impression
peut se faire sur papier vierge ou sur un fond de cartepré-imprimé. L’imprimante
IBM crée unecarte de France
(départements)
de 90 zones(fig.8)
en14 minutes; une carte contonnale de 3000 zones
(fig.9)
en 40 minutes. L’écran
cathodique
réalisera ces docu-ments en
quelques
secondes. Toutes lesopérations
nécessaires peuvent être assurées par une bonne dac-
tylographe.
Pour utiliser normalement la
cartographie
statistique automatique, il suffit d’instruire l’ordinateur de toutesles séries
originales (mais
seulement de cesséries).
Toute carte résultant de ces séries, d’une somme, d’une différence ou d’un
quelconque
rapport de séries entreelles sort automatiquement sur
simple
commande.En
conclusion,
la mise en oeuvre de l’énorme matériel statistique progressivementdisponible
ne peut devenir que massive et immédiate. Sa réduction doit faireappel
aux
mathématiques
et à lareprésentation graphique,
horsdesquelles il n’y
a pasd’intégration possible.
L’automa-tisation de la
cartographie,
associée à la documentation automatique est donc inéluctable. Lesresponsables
enont besoin pour appuyer leurs décisions sur l’ensemble de l’information moderne.
the
density
to be calculated.f)
to give"clearly"
on aaccompanying
sheet the data concerning thelegend,
thescale,
the values off scale(or "tails")
and the mathematical characteristics of the series.To
draw-up
a map :1 - the program, the statistical séries and a
controlling punched
card, is fed to the computer.2 - the computer produces a set of
punched
cards andthe accompanying sheet.
3 - the set of
punched
cards is fed into the reader which feeds the printer.The printing can be done on blank paper or on a paper with
preprinted
map The 1 BM printerproduces
a map of France(departments)
of 90 zones(fig.8)
in 14 minutes;a map of 3000 zones in 40 minutes. The visual
display
unit
produces
thèse documents in a few seconds. All the necessary opérations can be done by agood
typist.To use automatic statistical
cartography efficiently,
it is sufficient to feed the computer with an the
original
séries
(but only
thèse séries).Any
mapresulting
fromthèse séries, of a sum, of a différence or of any relation of séries between
themselves,
canautomaticly
be pro- duced at will.In conclusion the
handling
of the vast statistical mate- rial now available must be undertaken on a massive scale andimmediately.
lts réduction requires the use of mathematics andgraphical
représentation without which there can be nopossible
intégration. The auto-matisation of