R EVUE DE STATISTIQUE APPLIQUÉE
F. Y ATES
M. J. R. H EALY S. L IPTON
L’analyse des expériences répétées sur calculatrice électronique
Revue de statistique appliquée, tome 7, n
o2 (1959), p. 47-75
<http://www.numdam.org/item?id=RSA_1959__7_2_47_0>
© Société française de statistique, 1959, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
L’ANALYSE DES EXPÉRIENCES RÉPÉTEES
SUR CALCULATRICE ÉLECTRONIQUE
par F.
YATES, M.J.R. HEALY
etS. LIPTON
Parazt les
techniques
del’analyse statistique,
les cor-rélations
etl’analyse
de la variance constituent desméthodes
trèsintéressantes,
mais ellesimposent
àl’analyste
un volumeimportant
de calculsfastidieux
etsujets
à erreurs.L’emploi
d’une calculatriceélectronique
lève cette lourdehypothèque
et donne à cestypes
de t ra vaux un carac t è re rou t i- nier et courant, dès que des pro~rammesappropriés
ont été ré-di~és.
C’est ce que nous démontre pour un cas concretl’exposé
qui suit, qui est une communication de XX. Yates,
Healy
etLipton,
de la stationexpérimentale anélatse d’Expérimentation
aértcole et
biologique
de Rothamsted, communicationprésentée
àla Section Recherches de la British
Royal
1 StatisticalSociety
le 1er mai 1957. Elle a paru dans le volume 19,
n°2, 1957
-SérieB du Journal de cette Association.
La traduction en a été assurée par N. Pepe, Administrateur à l ’ I. N. S. E. E.
La
publication
de cette traduction estfaite
avec l’accordde la Bri t ish
Royal
1 Statistical 1Society,
que nous remercions d’avoir bien voulu permettre cetteprésentation
aux lecteursfrançais.
RESUME
Cette communication décrit les méthodes
qui
ont étédéveloppées
pourl’analyse
desexpérimentations répétées
sur la calculatriceélectronique
deRothamsted. Leur
principe général
est de faire traiter à la machine l’ensemble del’analyse,
ycompris
le calcul deserreurs-type
et desrésidus,
les résultats étant donnés sous une formeappropriée
à sa transmission immédiate àl’expéri-
mentateur. L’étude des
parcelles manquantes
et les calculs de covariancepeuvent également
être traités. Des calculspréliminaires
sur les données brutes sont exécutés par lamachine,
en utilisant un programmequi
est commun à tous lestypes
deplans.
Les données sontperforées
sur bande depapier,
une variable a- léatoire à lafois,
dans l’ordre où elles sont reçues del’expérimentateur,
c’est àdire
sans suppression
de caractère aléatoire.Des programmes sont maintenant
rédigés
pour lestypes
deplans
lesplus
courants,
tels que les blocs avecrépétition
au hasard destraitements,
les carréslatins,
lesplans
33(répétition unique)
et 2". Commeexemple,
un des programmes lesplus complexes,
celui pour lesplans
2" est décrit en détail. Ce programmetraite tous les
types
deplan
2" contenantjusqu’à
128parcelles,
ycompris
la"confusion" (1),
l’estimation des erreursprovenant
d’interactions d’ordresupé- rieur,
lesrépétitions fractionnaires,
les facteurs à 4 et 8niveaux,
et les carrésquasi-latins
8 x 8.On donne un bref
exposé
du mode de fonctionnement des calculatrices élec-troniques.
I - INTRODUCTION
En
1954,
nous avons eu la bonne fortune d’être dotés d’une calculatrice é-lectronique
au ServiceStatistique
de Rothamsted. C’est la calculatrice Elliot 401 N. R.D. C, qui est un
modèleprototype
construit par ElliotBros,
commepartie
du
plan
dedéveloppement
de la National ResearchDevelopment Corporation.
Elle nous fut attribuée par
l’Agricultural
Research Council.et par la National ResearchDevelopment Corporation
pourdévelopper
l’utilisation des calculatri-ces
électroniques
dans les recherchesstatistiques, particulièrement
dans le do- maineagricole
etbiologique.
On
peut,
en gros, diviser nos calculsstatistiques
en troistypes :
1/
calculsrépétitifs simples, qui
doivent être exécutés sur unegrande quantité
de données. Desexemples
sont fournis par lecalcul,
pour chacune des nombreusesunités,
de fonctionssimples,
tels querapports, produits,
trans-formation en racines
carrées,
enlogarithmes, etc.,
et la formation de totaux, de moyennes, de sommes de carrés et deproduits.
2/
Processusanalytiques qui impliquent
unelongue
suited’opérations,
a-vec seulement des calculs relativement
simples
àchaque stade,
tels quel’analyse d’expériences répétées,
etl’ajustement
deslignes
deprobits (2).
3/
Processusanalytiques qui
nécessitent un lourd travailnumérique,
telsque l’inversion des
matrices,
le calcul de valeurs et de vecteurs propres, la ré- solution deséquations
différentielles et autres seprésentant
engénétique
et enbiologie générale.
Dans leur phase
initiale dedéveloppement,
les calculatricesélectroniques
furent surtout utilisées pour desproblèmes
dutype
3. Avec ledéveloppement
decapacités
de mémoireplus grandes
et avec l’amélioration desdispositifs
d’entréeet de
sortie,
leuremploi
dans desproblèmes
destypes
1 et 2 est devenu deplus
en
plus praticable.
Nous avons
jusqu’ici
utilisé notre calculatrice pour les classesprincipales
suivantes de
problèmes statistiques (des
références à desdescriptions déjà
pu- bliées de travaux dans les diverses classes autres que lapremière,
sont donnéesentre
parenthèses,
desexemples d’applications
à desproblèmes
deplusieurs
deces classes sont
également
donnés parLipton, 1957).
---
(1)
Traduction du motanglais "confounding",
parlequel,
dans des expériences factorielles,on limite la taille des blocs en sacrifiant une partie des comparaisons indépendantes cor- respondant aux interactions d’ordre supérieur.
(2)
Note du traducteur : Lignes d’estimation de nuages de points, obtenues en portant en abscis-se les logarithmes des doses de stimulus, et en ordonnée les variables normales réduites
(augmentées
de 5) correspondant aux proportions desujets
ayant réagi à chaque dose.1/ Analyse
desexpériences répétées.
2/ Analyse
deprobits.
3/
Recherches surl’échantillonnage
et les erreursexpérimentales (Church
etLipton, 1956).
4/
Travaux à variable s aléatoiresmultiple s (Ashton, Healy
etLipton , 1957).
5/
Problèmes degénétique.
6/
Problèmesd’entomologie.
7/ Adaptation
de modèlesmathématiques
à dessystèmes biologiques (Patterson, 1956).
8/ Analyse d’enquêtes.
9/
Construction de tablesstatistiques (Fisher
etHealy 1956 ;
Fisheret
Yates, 1957 ;
Foster etRees, 1957).
10/
Recherchesexpérimentales
par échantillon aléatoire(méthodes
deMonte
Carlo)
dans lesproblèmes
destatistique mathématique.
La calculatrice a en outre été utilisée à la résolution de divers
problèmes
dans d’autres domaines
(non statistiques). (Le
Couteur etLipton, 1955 ;
etShofield et
Rees, 1956).
Dans la
présente communication,
nous nous proposons de décrire les mé- thodesqui
ont étédéveloppées
pourl’analyse
couranted’expériences répétées.
Comme
indiqué précédemment,
c’est seulement l’un desmultiples emplois
quenous avons trouvés pour notre calculatrice et, en
lui-même,
il ne serait pas suf- fisant pourjustifier
l’installation d’une calculatriceélectronique,
car de tellesanalyses peuvent être,
et sont, très efficacementexécutées
sur des machines de bureau.Toutefois, quand
ondispose
d’une calculatriceélectronique
etqu’il
y a une lourdecharge d’analyse expérimentale,
notreexpérience
a montréqu’on
pou-vait l’employer
très efficacement à cette fin. Lesujet
est en outre d’intérêtgé- néral,
en cequ’il
illustre la manière dont onpeut
instruire la calculatrice élec-tronique
à traiter des suitesd’opérations longues
etcompliquées.
Nous
disposons
maintenant de programmes pour lesplans
suivants(1) :
1/
Blocs avecrépartition
au hasard destraitements, jusqu’à
126 par-celles
(Healy).
2/
Carrés latinsjusqu’à
10 x 10(Lipton).
3/
Blocs avecrépartition
auhasard,
avecparcelles subdivisées, jusqu’à
128parcelles (Gower).
4/
Blocs avecrépartition auhasard,
avec unsystème
p x q de traite- mentsfactoriels, jusqu’à
128parcelles (Gower).
5/
Plans factoriels33, répétition unique (Yates
etLipton).
6/
Plans factoriels2", jusqu’à
128parcelles,. y compris
les carrésquasi-latins
8 x 8(Yates).
Ces programmes
correspondent
à environ 90% de
toutes lesexpériences
decourte durée
parvenant
auService,
et d’autres sont enpréparation.
Le s program-mes ont été
rédigés pendant
unepériode
de deux ans etdemi,
etplusieurs
dif-férences de détail
peuvent
êtreimputées
aux programmeurs,qui
s’instruisent par leur propreexpérience
et par celle des autres ; un des buts de cette com-munication est de relever les
leçons
de cettepériode.
Comme résultatpratique,
il faut mentionner que le nombre des
analyses
sur machine(en comptant chaque
variable aléatoire
analysée
commeunité)
a été de 834 en1955,
et de 1 701 en---
(1) Au cours de cette communication, les noms des chercheurs qui sont les responsables prin- cipaux des divers programmes sont mentionnés entre parenthèses.
50
19 56. Concurremment
la période
moyenne entreréception
des données d’une ex-périence
et achèvement del’analyse
a été considérablement réduite.II -
REMARQUES
GENERALES SUR LES CALCULATRICESELECTRONIQUES.
Il
peut
être utile de donner à ceuxqui
ne sont pas familiarisés avec les cal- culatricesélectroniques
une brèveexplication
de leur fonctionnement.On croit souvent que la
caractéristique principale
de ces calculatrices est leur vitesse. Ce n’estqu’une partie
de l’histoire. Toute aussiimportante
est leuraptitude
à effectuer des suitesd’opérations longues
etcompliquées
sans l’inter- vention d’unopérateur humain ;
enfait,
sans cettecaractéristique,
leur vitesse n’aurait que peu d’intérêt. Il est doncpossible
d’exécuter l’ensemble d’une ana-lyse statistique compliquée
sur la machine"sans
que la main humainen’y touche" .
.Les
caractéristiques
essentielles d’une calculatriceélectronique
sont :1/
Un organearithmétique
avec desregistres
associés(dont
chacun contientun
nombre), qui
estcapable
d’exécuter desopérations arithmétiques simples,
telles que
l’addition,
la soustraction et lamultiplication.
2/
Unemémoire,
danslaquelle
onpeut
ranger desnombres, s ’y reporter ,
et les
remplacer
par d’autres nombres selon besoins. Lesemplacements
de lamémoire sont
qualifiés d’ "adre sse s".
3/
Un organe de commandequi
fait exécuter à la machine lesopérations requises.
Lesopérations
réellement exécutées sont déterminées par cequ’on appelle
desinstructions, qui
sont elles-mêmes des nombresrangés
en mémoire(1). Après
exécution dechaque instruction,
la machine sereporte automatique-
ment à l’instruction suivante.
4/ Des dispositifs
d’entrée et de sortiequi permettent
de lire dans la ma-chine les nombres
(données, instructions, etc. )
et deperforer
les résultats . Pour accélérer le fonctionnement de la machine sans unappareillage
ex-trêmement coûteux et
compliqué,
la mise en mémoire s’effectue souvent à deuxou
plusieurs "niveaux",
dont la facilité et la vitesse d’accès varient.Dans
plusieurs machines,
dont la401,
on utilisepartout
la base de numé-ration binaire,
les nombres étant convertis en binaire et reconvertis en décimal par la machine elle-mêmependant
l’entrée et la sortie. Dans les machines lesplus simples,
en outre, la calculatrice fonctionne"en série",
c’est à dire que les nombres sontreprésentés
par des trainsd’impulsions pendant
lesopérations arithmétiques.
Chaque type
de machine a son propre code d’instructions. Elles varientbeaucoup en complexité,
et, pour programmer(c’est
à direrédiger
les instruc-tions)
d’une machineparticulière,
il faut d’abord que le programmeur se fami- liarise avec le code des instructions et lesrègles
de fonctionnement associées . Unecaractéristique importante
de tous lessystèmes
d’instructions est lapossibilité
de choix offerte par la discrimination. Dans unediscrimination,
ou---
(1)
Dans laterminologie
des calculatrices, on emploie d’unefaçon
générale le terme "mot"pour qualifier un nombre contenu dans la machine selon un code approprié (habituellement
binaire).
Un mot peut représenter un nombre réel, une instruction (ou, dans certaines ma-chines, une paire
d’instructions),
où l’on peut utiliser ses chiffres séparément ou par grou- pes comme indicatifs ou à d’autres fins.instruction de
test,
la machine teste le contenu d’un certainregistre,
pour voir s’ilcontient,
parexemple,
zéro. Selon le résultat du test, elle choisit ensuite l’une ou l’autre desséquences
d’instructionsprévues
dans le programme.Une autre
caractéristique importante qu’on
trouve dansplusieurs
machi-nes est ce
qu’on appelle
la"modification B"
des instructions. Ellepermet
l’ad- ditiontemporaire
du contenu d’un certainregistre
à l’instruction(qui,
commenous le mentionnons
ci-dessus,
e st en fait unnombre)
avantqu’elle
soit exécutée.Les instructions de discrimination ont
plusieurs
fonctions.Premièrement,
la machinepeut
exécuter desopérations
différentes selon des éventualités dif-férentes.
Ellepeut
aussi exécuter un calcul parapproximations successives,
en testant àchaque
stade si undegré
suffisant d’exactitude est obtenu. En outre, ellepeut
exécuter uneopération
un nombre de foisspécifié
encomptant
et entestant à
chaque cycle
si le nombrerequis
a été atteint. Dans le dernier cas, on ne demande habituellement pas à la machine d’exécuter la mêmeopération
à cha-que
cycle,
et c’est là que la modification Bprésente
un intérêtparticulier. Ainsi,
par
l’exemple,
sinous désirons additionner n nombresplacés
dans la mémoire à n adre sse sconsécutives,
hàh+n-1,
il fautprendre chaque
nombre tour à tour et l’additionner au totaldéjà
accumulé. Celasignifie
que l’adresse du nombre àprendre
doit être modifiée d’une unité àchaque cycle,
et quel’opération
doit êtrearrêtée
quandn cycles
ont été exécutés. Laséquence
réelle desopérations
néces-saires pour exécuter ce travail est, en gros, la suivante :
Soit A le
registre
danslequel le
total estaccumulé,
et C leregistre
exécu-tant le
comptage. Appelons (x)
le contenu de l’adresse x de la mémoire.1/
Mettre A à zéro.2/
Mettre n dans C.3/
Tester si(C ) e st z éro ;
s’il estnul,
exécuter lapremière
instruc-tion de la
séquence suivante ;
s’il n’est pasnul,
passer à 44/
Soustraire 1 de C.5/
Additionner(h
+(C) )
àA ;
revenir à 3.Si l’on
dispose
dela modification B,
la modification de l’adresse nécessaire dansl’opération
5 àchaque cycle peut
s’effectuer par l’additiontemporaire
de(C)
à la
partie
de l’instruction"Additionner (h)
àA", qui
contient l’adresse h.Cette
séquence d’opérations ne peut
s’exécuter de la manière fixée ci-dessus que s’il estpossible
de soustraire une unité directement d’unregistre
de comp-tage
et de tester ceregistre.
Dansplusieurs
des machines lesplus simples, comme la 401,
toutes lesopérations d’arithmétique
et de test sont exécutées dansun
registre unique (habituellement appelé
leregistre accumulateur).
Dans ce cas,il faut utiliser un autre
registre
pour accumuler le total. Le contenu de ceregis-
tre et celui du
registre
utilisé pour lecomptage
sont transférés dans l’accumula- teur et y sontrepris
alternativement.Comme on le voit dans la
description précédente,
pour exécuter untype particulier d’analyse, il faut préparer
uneséquence complète
d’instructionsspé-
cifiant tous les stades nécessaires et tenant
compte
de toutes les éventualitésqui peuvent
seproduire.
Onappelle
programme une telleséquence d’instructions.
La
préparation
de s programme s pour le stype s plus complexe s d’analyse requiert
un
temps
et une habiletéconsidérable, mais,
une fois que les programmes néces- saires ont étérédigés
etsoigneusement testés,
la machinepeut
êtreappliquée
à l’exécution de
n’importe quelle analyse particulière
parsimple
lecture du pro- grammeapproprié.
Comme seules les
opérations
lesplus simples peuvent
être effectuées di-rectement par
les calculatricesélectroniques -
parexemple,
la401,
comme denombreuses autres
machines,
nepeut
exécuter la division directement - il est essentiel que des séries standard d’instructions soientrédigées
pour exécuter toutes lesopérations
courammentemployées.
De telles séries standard d’ins- tructions sontappelées
sous-programmes. Elles sontrédigées
defaçon
que la machinepuisse
recevoir l’ordre d’entrer dans le sous-programme en toutpoint requis
du programme, et de revenir au programmeprincipal quand l’opération
desous-programme a été exécutée. Une librairie
appropriée
de sous-programmes est essentielle pour laprogrammation
desopérations plus complexes.
On a
déjà publié
une courtedescription
de la calculatrice Elliott 401(Lipton, 1955).
Aupoint
de vue du programmeur, lescaractéristiques
essentielles sont lesopérations arithmétiques, qui comprennent l’addition,
lasoustraction,
lamultiplication,
lesdécalages
vers la droite et vers lagauche,
lanon-équivalence
et la
comparaison ;
les tests zéro etnégatifs
del’accumulateur ;
la mémoirequi
contient 2 944
emplacements
de 32 chiffres binaireschacun ;
troisregistres
àaccès immédiat
qu’on peut
utiliser pour la modificationB ;
et un autreregistre qu’on peut
combiner avec l’accumulateur pour travailler avec des mots de lon- gueur double. L’entrée dans la machine se fait par bande depapier perforée (on
a récemment installé l’entrée par cartes
perforées) ;
la sortie se fait sur uneperforatrice
de bande àgrande vitesse,
ou autrement sur une machine à écrireélectrique.
La mémoire est undisque
rotatif à revêtementmagnétique, portant
23"pistes"
de 128emplacements
chacun. Une de cespistes
contient l’informa- tionpermanente, comprenant
divers sous-programmes d’entrée et un sous- programme de division. Parmi les autrespistes,
seize sontappelées pistes
àrelais et sont toutes référencées
piste 7 (individuellement piste 7/0, 7/1, ... , 7/15) ;
une seule de cespistes
estdisponible
à tout momentdonné,
une instruc- tion machine étant nécessaire pour la commutation à unepiste
différente au moyen d’une série de relais àgrande
vitesse. Cettecaractéristique, qui
ressemble àl’emploi
d’une mémoire"à retour"
dans certaines autresmachines,
a eu une influ-ence considérable sur la
conception
de nos programmes. La machine est raison- nablementrapide :
-. l’addition et lamultiplication
demandantrespectivement
0, 1 et3,
1millisecondes,
mais une unité detemps plus pratique
est letemps
de révo-lution du
disque, 12,
8millisecondes, qui représente
letemps
maximum d’accès à unnombre ou à une instruction. La commutation d’unepiste
à relais à une au- treprend
environ 10 millisecondes.III - LE PROBLEME GENERAL DE L’ANALYSE DES EXPERIENCES REPETEES.
L’analyse
d’au moins lestypes
lesplus simples
deplans expérimentaux
est un travail assez
direct,
et l’on asuggéré
diversestechniques générales
parlesquelles
onpeut rédiger
un programmeunique
pouranalyser
les données deplusieurs types
différents deplans (Tocher, 1952 ; Hartley, 1956). Toutefois,
on ne se rend pas
compte
couramment que le processuscomplet, depuis
le stadeauquel
les chiffres arrivent del’expérimentateurjusqu’au
stadeauquel
les résul-tats
analysés
luireviennent, représente
presque autant de"travail
debureau"
que de calcul au sens étroit. Un de nos
principaux objectifs
a été de faire traiterà la calculatrice le
plus possible
de ces processus, ycompris
laprésentation
des résultats sous une forme
qui
fûtappropriée
à une transmission immédiate àl’expérimentateur.
-Cela nousa conduit, en même temps
que la mémoire assez pe- tite de la401,
àrédiger
un certain nombre de programmes nettementspéciali- sés,
au lieud’essayer
derédiger
un programmeunique
couvrant tous lestypes
de
plans
lesplus
courants(1).
---
(1) Cf. également Rowel
(1954),
où est décrit un programme pour le calcul séparé de chaque répétition des principaux effets et interactions d’un plan 2* avec confusion, pour les totaux de traitement présentés dans un ordre standard. Certaines transformations préliminairesdes données
(122
séries derésultats)
et des récapitulations des résultats combinés étaientégalement
exécutées par la machine.Le processus
complet d’analyse
suivi dans notre programme estexposé ci-après en trois
stades :entrée, analyse
et sortie. Un programmeparticulier,
celui de
l’analyse
desexpérimentations
factorielles2",
sera ensuiteexposé
endétail comme
exemple
de lafaçon
dont les diverses éventualités survenant dans lesexpérimentations
du mêmetype général peuvent
être traitées dans la struc- ture d’un programmeunique.
IV - ENTREE ET CALCULS PRELIMINAIRES.
Le
premier
programmerédigé,
celui del’analyse
des blocs avecrépar-
tition au hasard
(Healy),
nécessitait laperforation
du numéro debloc,
du numérode
traitement,
et du rendement consécutivement pourchaque parcelle.
Il se révé-la
rapidement
non-satisfaisant. Enpremier lieu,
il y avait couramment deux ouplusieurs
chiffres relevés pourchaque parcelle qui
demandaientanalyse -
parexemple,
rendement engrain
et rendement enpaille
dans desexpérimentations
sur les céréales - et la méthode
précédente
deprésentation
des données néces- site unerépartition
descodages
du bloc et du traitement pourchaque
variable aléatoire.Et,
cequi
estplus important,
les chiffres relevés n’étaient habituel-lement pas
ceux dont on avait besoin pourl’analyse.
Pour lemoins,
une conver-sion
(disons
de livres parparcelle
enquintaux
paracre) (1),
estnécessaire,
etfréquemment
de nouvellesquantités
sont à déduire de cellesqui
ont été relevées initialement.Ainsi,
dans uneexpérimentation
sur lesbetteraves,
les chiffres relevéspeuvent
être :A - Rendement des racines brutes.
B - Poids de l’échantillon brut.
C - Poids de l’échantillon net.
D -
Pourcentage
de sucre dans l’échantillon net.E - Poids des
tiges.
Dans ce cas, les chiffres nécessaires à
l’analyse
sont :1/
Racinesnettes,
A xC/B,
converti en tonnes par acre.2/ Pourcentage
de sucre, D.3/
Sucretotal,
D x A xC/B,
converti enquintaux
par acre.4/ Tiges, E,
converti en tonnes par acre.Sur une machine de
bureau,
les conversions sont habituellement exécutéesaprès analyse, mais,
même dans ce cas, les calculspréliminaires
nécessaires demandent presque autant detemps
quel’analyse
réelle : ils sontégalement
unesource féconde d’erreurs.
Il est nettement désirable de faire exécuter la conversion par la calcula- trice et,
également
le calcul de variablesdéduites,
comme le sucre-total si lepoids
desracines,
lepourcentage
en sucre, et le sucre total demandent tous uneanalyse.
Le calcul dequantités
telles que lepoids
des racines nettes àpartir
dupoids
de s racine sbrute s,
et lepoids
de s échantillons bruts et nets, e stplus
mar-ginal, mais,
dans notre cas, nous l’avonségalement
trouvéavantageux.
Comme ces calculs
préliminaires
ne sont pas affectés par leplan d’expé- rimentation,
un programmegénéral
d’entrée pour lesplans expérimentaux
a étéétabli
(Lipton, Healy).
Ce programme lit lesdonnées,
exécute sur elles les cal- culsappropriés
etenregistre
les variables résultantes dans desemplacements
---
(1) Note du traducteur : livre
(pound) =
453, 59 grammes ; quintal(hundredweight
ouc.w.t)
=112 livres = 50 k. 80 : acre = 40, 4672 ares ; tonne (20
c.w.t)
=1016, 04 kg.
appropriés
de la mémoire. Le programme exécute en outre certaines autresopé-
rations.Premièrement,
il transcrit(sur
la bande desortie)
un en-têteperforé ,
dans la bande des données. L’identification des
sujets
à la sortie est essentielle dans le travail deproduction
courant.Deuxièmement,
ilprocède
à certaines vé- rifications : si le nombre d’éléments corrects n’est pasperforé
dans un groupe dedonnées,
un indicatif estperforé
defaçon répétée ;
et, pourpermettre
un certain contrôle sur les relevés bruts et les erreurs deperforation,
les valeurs dumaximum,
du minimum et de la moyenne sontperforées
à la lecture dechaque
section de données et à
chaque
formation d’une nouvelle variable aléatoire. Troi-sièmement,
la moyenne et le total dechaque
variable sontrangés
enmémoire ,
en même
temps
que les valeurs de lavariable,
pour les utiliser dansl’analyse subséquente.
L’emploi
de ce programmepermet
de standardiser laperforation
des don-nées, caractéristique qui simplifie beaucoup
la tâche depréparation
des bandesd’entrée dans la machine.
Le programme
opère
de la manière suivante : avantchaque opération
cer-tains indicatifs sont lus. Ils
indiquent
au programme s’il doit lire les données(et
dans ce cas, les données sontrangées
enmémoire),
la fonction(s’il
y en aune)
àcalculer,
lesemplacements
desopérantes,
et oùplacer
la variable résul- tante. Ondispose
desopérations
suivantes :0/
Pas de fonction(entrée seulement).
1/
z =x + y
2/
z = x - y3/
z x. y4/
z = x/
y5/
z = x. c6/
z = x(transférer
les données à de nouveauxemplacements).
7/ z = x + c
8/
z =logw (x
+c)
9/
z = arcsin BJ x 10/
z =V (x + C)
où x et y sont des
variables,
z la fonction et c une constante. Lesproduits
et lesquotients peuvent
être mis à l’échelle par despuissances
de 10. Dans le program-me
actuel,
les indicatifs sont codés sous forme depseudo-instructions (1).
C’estcommode pour
l’entrée,
car un programme pour l’entrée des instructions est enpermanence
disponible
dans la mémoire. Nous nous proposons toutefois d’intro- duire un codeplus simple
pour lesindicatifs, qui permettra
au programmeur derédiger
lesopérations qu’il
désire ensymboles algébriques,
au lieu d’avoir a é- tablir lespseudo-instructions.
Une
caractéristique importante
de ce programme est que toutes les données relatives à une variableunique
sontperforées
consécutivement dans laséquence
où elles sont
enregistrées.
Tout cequi
estnécessaire,
c’est que laséquence
soitla même pour toutes les variables. C’est un
avantage considérable,
car l’infor-mation sur les différentes variables est souvent
enregistrée séparément.
---
(1) Dans la 401, une instruction
(32
chiffresbinaires)
se compose d’une série de huit nombres(3, 7,
3, 3, 3, 3, 3, 7 chiffres binairesrespectivement),
perforés chacun en base décimale (excepté que les nombres supérieurs à 99 sont perforés sous forme de deuxcaractères).
55
V - ENTREE DES CODAGES BLOC ET TRAITEMENT’.
Le numéro de bloc et le numéro de traitement
(en
code factoriel pour lesexpériences factorielles)
dechaque parcelle
sontperforées
une seulefois,
à lasuite des
données. Si,
comme c’est habituellement le cas, laséquence
est telleque les données se
présentent
bloc parbloc,
onpeut
omettre les numéros des blocs.Les besoins pour l’entrée du
codage
du bloc et du traitement varient selon leplan expérimental, et,
parconséquent,
cettepartie
de l’entrée est exécutéepar le programme relatif à ce
plan. Quand
lecodage
estlu, (ou après
vérifica-tion),
il estperforé
à lasortie,
de sortequ’on dispose
d’un relevéimprimé .
Pourvu que les données soient
enregistrées
dans l’ordre où elles seprésentent
dans le
champ d’expériences (sans suppression
de lacaractéristique aléatoire), l’implantation
réelle duchamp
sera(sauf
certaineslimitations) reproduite
dansle relevé
imprimé.
En
outre,
on a tenucompte
de s variante spos sible s
du code de s traitements:ainsi,
dans uneexpérimentation
factorielle3 x 3 x 3,
les niveaux d’un facteurpeuvent
être codés0, 1,
2 ou1, 2, 3,
selon la nature des traitements. Il serait bienentendu possible
à unperforeur
habile detransposer
mentalement un de ces co-des en
l’autre,
mais un tel processus est évidemmentsujet
à amener des er-reurs,
particulièrement
si le codepeut
varier pour des facteurs différents dans la mêmeexpérience.
Parconséquent,
le codeest.perforé
telqu’il
estécrit,
ettransposé par la machine
à l’entrée. Enfait,
cetteopération
se programme trèssimplement,
et elle illustre la facilité aveclaquelle
onpeut
donner l’ordre aux calculatricesélectroniques d’accepter
les données sous la forme laplus
com-mode pour l’utilisateur. Tout ce
qui
estnécessaire,
c’est que les trois valeurs de code des niveaux lesplus
basapparaissent
d’abord sur labande,
suivies ducodage
dechaque parcelle.
Lors de lalecture,
les valeurs sont assemblées engroupes de
trois,
lepremier
groupe de trois étant soustrait dechaque
groupesubséquent.
Unesimple
boucle double d’instructions assure l’ensemble de la lec- ture. Lesopérations
pour unerépétition unique (27 parcelles)
sanscodage
desblocs sont essentiellement les suivantes
(P
etQ
sont lesregistres) :
En réalité, il y
a naturellement descomplications supplémentaires.
On doitprévoir
la lecture ducodage
des blocs s’il estperforé,
ou lasuppléer,
s’il estimplicite.
Aucommencement,
il faut lire la bandejusqu’à
la rencontre du carac-tère de
début,
et à lafin,
on doit faire une vérification de ce que le caractère final a été atteint(Si
ce n’est pas le cas, des 1 seront continuellementperforés,
ce
qui indiquera
alors un nombre incorrect de caractères sur labande).
On doiten outre
prévoir
la lecture et laperforation
du retour de chariot et du saut de li- gne à des intervallesappropriés.
Le
codage
du bloc et du traitement est vérifiéaprès l’entrée,
pour s’as- surer,par exemple,
quechaque
traitement seprésente
une seule fois dans cha-que bloc d’une
expérience
sur blocs traité s au hasard. Enpratique,
onpeut
ordi-nairement le faire en utilisant une section du programme
d’analyse principale .
56
Dans le programme 2"
(décrit ci-après),
l’énumération desdegrés "confondus"
de liberté assure une vérification suffisante du
codage
du bloc et du traitement.VI - ANALYSE.
En tant que
problème
decalcul, l’analyse
de donnéesexpérimentales
neprésente
pas de difficultés formidables. Les processus que nousemployons
sont, pour leurpartie principale,
semblables à ceuxqu’on emploie
sur machines debureau,
bienqu’on
y aitapporté
certainesmodifications.
Un stade de base de
l’analyse
est la formation de divers totaux pour lesblocs,
leslignes
et lescolonnes,
lestraitements,
etc.. C’est tout à fait directsur une machine à modification
automatique
des instructions(modification B) .
La
partie
du mot de codecorrespondant
au bloc et du traitement pourchaque
par- celle est utilisée pourindiquer
àquel
membre dechaque
série de totaux le ren-dement
correspondant
est àajouter. Ainsi,
parexemple,
l’indicatif d’uneexpé-
rimentation factorielle33
estperforé
sous la formeBPQR,
où chacune des lettresB, P, Q
et R est un nombrecompris
entre 0 et 2 ou entre 1 et3, spécifiant
res-pectivement
le numéro debloc,
et le niveau de chacun des 3 facteurs. Pendant l’entrée il est modifié et mis en mémoire sous forme de 10 chiffresbinaire s (cha-
que
paire ayant
l’étendue 0 à2)
sous la formeBPQRP.
Pardécalages successifs,
il est
décomposé
pour donnerB, PQ, QR,et RP,
et on utilise ces nombres pour identifier le total de bloc etl’inscription particulière
dans chacune des 3 tables à double entrée. Les chiffresqui composent (par exemple) PQ
vont en réalité de0000 = 0 à 1010 =
10,
en omettant le 3 etle 7 ;
on attribue à la table 12emplace-
ments de mémoire
consécutifs,
les trois lacunes étant utilisées pour procurer les totaux delignes qui
constituent un desprincipaux
effets.Après
conversion enmoyennes, les 12 nombres sont
imprimés
sous forme d’une table 3 x 4 par la méthode décrite dans la sectionsuivante.
Quand
on a formé les totaux de blocs detraitements,
etqu’on
les a con-vertis en moyennes, on calcule et on
place
en mémoire les résidus pourchaque parcelle.
Les résultats ne sontplus exacts,
et pour éviter des erreursd’arrondi,
nous prenons 10 chiffres binaires
supplémentaires (environ
3positions
décimalessupplémentaires), à la fois pour les
moyennes et pour les résidus.Quand
on for-me les
résidus,
leproblème
d’associer les moyennesappropriées
de blocs et detraitements à
chaque
rendement est un de ceuxqui
ontdéjà
été résolus pour la formation destotaux,
et on utilise la mêmeséquence d’instructions,
les modifi- cations mineures nécessaires étant faites par la machine.La formation et la mise en mémoire des résidus
jouent
un rôleimportant
dans nos programmes. Pour commencer, ils forment la base de vérifications des totaux et des sommes de carrés ils forment
également
unepartie
de notre mécanisme pour traiter la covariance et lesparcelles manquantes,
décrit ci-après. Indépendamment
decela,
lapossibilité d’imprimer
le résultat sur le mê-me tableau que les
parcelles
initiales a montré son intérêt pour examiner lescauses
d’erreurs-types trop
élevées.Le stade suivant de
l’analyse
est le calcul des sommes de carrés pour l’a-nalyse
de la variance.Ici,
leprincipal danger
estqu’un
débordement seproduise ,
c’est à direqu’on dépasse
lacapacité
duregistre.
Celapeut
s’éviter enemployant
une moyenne de travail. Comme la machine n’a pas de
préférence
pour les nom- bres"simples",
il est aussi commode de travailler avec les écarts à la moyenne réelle. Cela a legrand avantage qu’on
n’a pas besoin de"correction
à lamoyenne" .
.Il
faut,
à cetégard,
noter le contraste entre calculatricesélectroniques
etcalculateurs de bureau.
L’emploi
des écarts à la moyenne dans les calculs surmachine de
bureau
serait excessivementfastidieux,
parcequ’ils
sontpénibles
àcalculer,
doivent être écritsquand
on lescalcule,
etrequièrent
la conservation de décimalessupplémentaires
pour assurer laprécision
nécessaire. D’autrepart,
sur les calculatricesélectroniques,
onpeut
programmer trèssimplement
le calcul des
écarts, qui prend
peu detemps
pour son exécution. En outre, une calculatriceélectronique
estcomplètement
indifférente au nombre de chiffres dans les nombresqu’elle manipule,
pourvuqu’ils
restent dans lacapacité
desregistres.
Deux autres alternatives
possibles,
que nous avons toutes les deux u-tilisées, impliquent
de travailler avec des chiffresexacts,
en formant soit nIx 2 -(~ x)2, soitl[nx - 1 (x) ]~
Lapremière expression
est n , et la seconden 2 , multipliées pari (x - X)2 .
Dans cesalternatives,
laplus grande
taille des nom-bres est dans une certaine mesure
compensée
par l’absence de chiffres à sur-veiller.
Indépendamment
de l’entrée et de lasortie,
la calculatrice 401 n’a pas decaractéristiques
de vérificationincorporées
parconstruction,
et tous nos pro- gramme scomportent
des vérifications pour nousprémunir
contre les fautes mo-mentanées de la machine
qui
seproduisent
éventuellement. Une excellente véri- ficationgénérale
est basée sur lapropriété
additive del’analyse
du tableau de lavariance,
du fait que tous ses éléments ycompris
la somme résiduelle des car-rés,
sont calculés directement. Une autre vérificationqu’on peut
exécuter est celle de former les totaux debloc,
detraitement,
etc. , desrésidus, qui
doiventêtre tous
égaux à
zéro(indépendamment
des erreursd’arrondi) ;
onpeut
utiliser àcettefinlamêmeséquence
d’instructions pour former les totaux et les résidus . L’actionentreprise quand
une vérification est défaillante demande à être considérée. Dans nospremiers
programmes, on faisaitsimplement
arrêter la machine.Toutefois,
cela ne fut pas trouvé satisfaisant parce que cela entraînaittrop
decontemplation
stérile deslampes signal.
Parsuite,
notrepolitique
ac-tuelle, quand une
vérification estdéfaillante,
est derépéter
la sectionappropriée
du programme, ou autrement de continuer de la
façon habituelle,
laissant l’action ultérieure à décideraprès
examen des résultats. Les vérificationsqui
ont étésatisfaisantes,
sontindiquées
par laperforation
d’unpoint.
A ce propos, il faut mentionner quequand
on utilise la sortie parperforation (comme
c’esttoujours
le cas dans le travail de
production),
les résultats ne sontdisponibles pour
exa-men
qu’après
avoir étéimprimés
sur latéléimprimante,
processusqui
introduitun
décalage
detemps
considérable.Comme notre
pratique
est de ranger en mémoire les rendements des va-riables sur des
pistes
à relaisdifférentes, l’analyse
successive des différentes variables esttrèssimple.
Comme mentionnéprécédemment,
une référence à lapiste
7implique
une référence à lapiste
à relaisqui
est en circuit à ce moment.Une modification d’une variable à la suivante s’effectue donc
simplement
en chan-geant
les instructions de commutation des relais. Enpratique,
il est souvent commoded’employer
unpetit
sous-programmequi
commute à lapiste
de la va-riable en cours
chaque
fois que c’est nécessaire.VII - SORTIE.
Ici,
nous nous sommes efforcés desimplifier
les choses autant que pos- sible àl’expérimentateur qui
doit faire usage desrésultats,
celarequiert
que :a/
tous les résultats nécessaires soientfournis,
et queb/
laprésentation
soit satisfaisante.La fourniture de résultats