R EVUE DE STATISTIQUE APPLIQUÉE
C. S TELLMANN P. B ORNAREL
Une application de l’analyse de variance à un problème de biologie industrielle
Revue de statistique appliquée, tome 18, n
o1 (1970), p. 99-109
<
http://www.numdam.org/item?id=RSA_1970__18_1_99_0>
© Société française de statistique, 1970, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNE APPLICATION DE L’ANALYSE DE VARIANCE A UN PROBLÈME DE BIOLOGIE INDUSTRIELLE
C. STELLMANN
etP. BORNAREL (*)
INTRODUCTION
La tendance de la
production biologique
actuelle estd’acquérir
le ca-ractère industriel :
- industriel par les
quantités
de matières mises enjeu,
visant la commercialisation desproduits
dans des secteurs autrefois non sollicités .- industriel par la
technologie
des contrôles et desrégulations
diverses
qui
fontappel
à destechniques physico-chimiques longtemps
réser-vées à l’industrie
chimique,
tels que larégulation
de latempérature
et du H, et les contrôlesélectroniques qui s’y
rattachent.- industriel par la
budgétisation
inévitable des moyens pour obte- nir une rentabilitéoptimale
d’uneproduction,
car l’amélioration d’un rende- mentjouant
sur leprix
de revientpermet
une commercialisation efficiente dans notre société où la concurrence est un facteur d’émulation entre tech- niciens.L’analyse statistique pénètre progressivement
dans le domaine biolo-gique,
au même titre que lestechniques perfectionnées
del’électronique
etde l’automation. Cette
analyse
devientindispensable
dans laproduction
bio-logique
industrielle par le fait :- du nombre
important
de facteurscontrôlés,
- du nombre croissant de données
quantitatives qui
tendent àsupplanter
les donnéesqualitatives,
- de la nécessité de
"quantitativer"
les conclusions desanalyses . L’analyse
devariance,
detype factoriel,
est un des outilsstatistiques qui répondent
au mieux auxquestions
desexpérimentateurs
et desproduc-
teurs.
Nous limitons la
bibliographie,
trèsfournie,
concernant ceproblème,
à
quatre
ouvrages, SCHWARTZ[1] ,
PHILIPPE[ 2],
MATHER[3],
LISON[8]
où nous avons
puisé
lesprincipes
de notreexposé.
---
(*) Collaboration technique de JP MARTEL (pour la programmation sur ordinateur).
Travail de l’Institut Français de la Fièvre Aphteuse - LYON. Directeur Dr. C.
100 1 - EXPOSE DU PROBLEME
Cet
exemple
que nous traitons est tiré d’une mise aupoint
de la cul- ture industrielle du virusaphteux
selon latechnique
FRENKEL[4].
De nom-breux facteurs influent sur le rendement d’une telle
technique et,
dansl’expé-
rience
présentée, quatre
facteurs seront étudiés :- l’inoculum des cultures
qui
est la souche virale utilisée pourensemencer les réacteurs de culture. Cet
inoculum,
dans notreexemple,
est obtenu selon deux
procédés
différents.- le milieu de culture dont la
composition biochimique
est connu .Deux milieux de culture sont testés dans notre essai.
- les échantillons de virus
produit,
utilisés pour lescontrôles,
sont traités selon 3
procédés.
- la
cinétique
de laproduction
en fonction du nombre de passages d’une culture à une autreculture,
dans notreexemple
5 passages sont tes- tés.Le critère de lecture est le titre du
virus,
estimé par réaction de fixation ducomplément [5]
etexprimé
enlogarithme
décimal pour "norma- liser" les résultats.Les facteurs
durée, température
de culture et aération sont constants pour l’ensemble del’expérience.
Le
problème
pour leproducteur
est de choisir la meilleure combinaison des 4paramètres qui
entrainera uneproduction optimale
dans les conditions industrielles. Un telproblème
nepeut
être étudiéqu’à
l’aide d’unplan expé-
rimental
rigoureux, qui permet
l’étude des interactions éventuelles entre lesquatre paramètres.
II - ETABLISSEMENT DE SOUS TABLEAUX POUR LES CALCULS NUME-
RIQUES.
Lorsque
les calculs sont effectués à la machine à calculer detype
courant
(type
ADDOX4000),
le tableau n° 1 doit êtredécomposé
en autantde sous-tableaux que de
composants
de la variance pour éviter toute erreur et faciliterl’interprétation
ultérieure.Ce mode
opératoire
est valable dans tous les cas, maislorsque
lenombre de facteurs est
supérieur
à4,
oulorsque
le nombre de données est de l’ordre de150,
laprogrammation
de telsplans
factoriels sur machine à calculerperfectionnée
est nécessaire(type
OLIVETTI PROGRAMMA101).
Lorsque
le nombre de facteurs estsupérieur
à 5, ou le nombre de donnéessupérieur
à150,
laprogrammation
sur ordinateur estindispen-
sable(type
IBM1130)
ou autre(360/40)
et dans ce cas laprésentation
desdonnées
peut
être différente.Les sous-tableaux sont établis en calculant la somme des données dans
un ordre
précis
pourchaque composant
de la variance et le calcul dechaque
variance est lié à une formule
générale :
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 1
102
Le terme entre
parenthèse
est la somme des carrés dechaque
com-posant.
III - TEST DE F ET SIGNIFICATIVITE
Pour tester la
significativité
des calculsprécédents,
nouseffectuons ,
pour
chaque
source de variation lerapport :
FN1 =
Variance de la source de variationN2
Variance résiduelle En fonction de :Nl = ddl du numérateur N2 = ddl du dénominateur
des tables
(SCHWARTZ, PHILIPPE, MATHER)
donnent laprobabilité limite ,
accordée par lehasard,
pour obtenir les valeurs de F.L’interprétation
desprobabilités
obtenuesest,
engénéral,
la suivante :-
lorsque
laprobabilité
est inférieure à0.01,
l’effet de la sourcede variation est considéré comme une
certitude,
-
lorsque
laprobabilité
estcomprise
entre 0. 01 et0. 05,
l’effet est vraisemblable etsignificatif.
-
lorsque
laprobabilité
estcomprise
entre 0.05 et 0.10 l’effet nécessite une confirmationexpérimentale
enmultipliant
les essais.-
lorsque
laprobabilité
estsupérieure
à0.10,
l’effet est consi- déré comme peu vraisemblable et nonsignificatif.
Ces
règles
sont édictées par les besoins del’expérimentateur.
IV - RESULTATS ET INTERPRETATION DE L’ANALYSE
Les résultats des calculs sont transcrits dans le tableau n° 2. L’in-
terprétation
d’un tel tableau doitrépondre
à un doubleproblème :
- le
problème purement statistique
ou les conclusions seront lasynthèse
d’un certain nombred’affirmations,
reflets del’analyse,
- le
problème purement technique
où les conclusions doivent êtrepratiques
et réalisables.Nous nous attacherons
particulièrement
aupremier
voletstatistique.
Le tableau n" 2
indique
que tous les effetsprincipaux
P. E. S. et M sonthautement
significatifs,
mais du fait de lasignificativité
des interactions depremier ordre,
PS etPM,
et de deuxièmeordre,
PES etPSM, l’interpré-
tation des effets
principaux
est fonction de l’interaction de l’ordre leplus
élevé.Les
graphiques
n°1, 2, 3,
4 et 5 concrétisent les fluctuations duesaux divers
facteurs,
et nous remarquonsqu’une
intéractionsignificative
setraduit par un non
parallélisme
des courbesreprésentatives
desréponses.
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 1
Graphique n° 1
Graphique n" 2
Graphique n° 3
Graphique n° 4
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 1
104
Graphique n" 5
106 TABLEAU n° 2
RESULTATS DE L’ANALYSE : VARIANCE ET TEST DE SIGNIFICATIVITE
. ddl = N-1
N = niveau du facteur
** Produit des ddl des facteurs, contenu dans l’interaction ddl (P) = 4 ddl (E) = 2 ddl (PE) = 8
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 1
Conclusions
statistiques
a)
Lapremière
conclusionpratique
est que le titre du virus est maxi-mum entre le 7ème et le 9ème passage
(graphique
n"1).
b)
Le choix de la souche inoculum estlié,
à la fois aumilieu,
à l’échantillon et au passage, nous pouvons tout d’abord étudier le rôle du mi- lieu : .-
d’après
legraphique
n° 2 :S2
estsupérieur
à81,
d’une valeur moyenne de 0.082(différence logarithmique),
soit un facteur demultiplica-
tion 1.203.
-
d’après
legraphique
n° 3 :M2
estsupérieur
àMl,
d’une va-leur moyenne de
0. 062 ,
soit un facteur demultiplication
1.154.-
d’après
legraphique
n" 4 :S2M2 est supérieur à S2M1,
différence moyenne : 0. 06(X 1.149)
S2Ml est supérieur à Sim 2’
différence moyenne : 0. 04(X 1. 097)
S M est supérieur à S 1Mi
différence moyenne : 0.035(X 1. 084)
donc
S2M 2
>S 2m
1 >SI M2
>S1M
1C’est dire que la souche
S2
est d’autantplus
activequ’elle
est cultivéeavec le milieu
M2,
non parsimple
addition des deuxcomposants (S2 + M2)
mais par
multiplication (S 2
xM2),
cette interaction fort intéressante pour leproducteur
nepourrait
être mise enévidence,
à boncompte,
que pour ceplan expérimental.
Les différences moyennes ne sont valables que sur l’ensemble des passages, mais le
graphique
n° 4permet
de calculer les différences pourchaque
passage.c)
L’interactionPES,
nousguide davantage quant
au choix de lasouche ;
en
effet,
des études antérieures[6]
ont montré que la valeurimmunogène
du virus FRENKEL est
optimale lorsque :
E2
est maximumLa différence E - E est minimale
2 1
La différence
E3 - E
1 est minimaleLe
graphique
n° 5 résume les variations de ces valeurs et nous cons-tatons que
E; S 2
esttoujours supérieur
àE2S1 et
que la différenceS2E 2 - S2El
1 esttoujours supérieure
àS E - S1 E1.
d)
En définitive la meilleure combinaison des 4paramètres
est la sui-vante :
"Souches
S2’
MilieuM2
etPassage
7 à9",
et nous pouvonsquantifier l’augmentation
du rendement : la combinaisonS 2m 2 multiplie
le rendement par 1.365 en moyenne parrapport
àSl M1.
Le
technicien,
en dernier ressort, choisira la solution laplus propice
à sonproblème
par lacomparaison
des différents rendementsquantitatifs
108
qu’il pourrait espérer obtenir,
et le calcul des erreurs lui donnera les li- mitesexpérimentales théoriques
de son choix.V - CALCUL DE L’ERREUR SUR LES VALEURS
NUMERIQUES
La variance résiduelle est S2 = 0.00136.
- pour une
réponse, l’écart-type
sera s = 0.037 et 2s = 0.074 pour unrisque
d’erreur de a = 0.05.- pour une somme de N
réponses,
la variance seras 2/N
et l’écarttype s/VN
- pour une différence entre deux moyennes de N
réponses chacune,
la variance sera 2
S2/N.
CONCLUSION
Le
progrès
de latechnologie biologique
et les nécessités de la renta- bilitéoptimale
de laproduction biologique
ontrapidement
entraînél’emploi d’analyses statistiques
dans la recherche et la mise aupoint
desprocédés
de fabrication.
L’analyse
de variance detype
factorielpermet
d’étudier l’action simul- tanée deplusieurs
facteurs(qui peuvent
être sélectionnésauparavant
parune
analyse classique),
cequi apporte
une économie des moyens et uneprécision
sur les interactions éventuelles entre ces facteurs.Ce
type
deplan expérimental
entraîne certainesobligations,
peu res-trictives,
et les calculsnumériques complexes
sont facilités par l’utilisa- tion de machines à calculerperfectionnées et/ou
d’ordinateurs.BIBLIOGRAPHIE
[1]
SCHWARTZ D. - Méthodesstatistiques
àl’usage
des médecins et desbiologistes.
Editions médicales FLAMMARION PARIS 1969.[2 ] PHILIPPE
J. - Les méthodesstatistiques
enpharmacie
et en chimie.Monographie
depharmacie
MASSON &Cie ,
PARIS 1967.[3] MATHER K. - Analyse statistique
enbiologie.
ACTA Editions GAUTHIER-VILLARS,
PARIS 1965.[4]
DUBOUCLARDC. ,
GILBERTH.,
FONTAINE J. et ROUMIANTZEFF M. - Nouveauxaspects
de la culture industrielle du virus de la fièvreaphteuse.
IXecongrès
international deMicrobiologie
de MOSCOU24-30 Juillet 1966.
[5] ROUMIANTZEFF M.,
STELLMANN C. et DUBOUCLARD C. -Technique
de fixation
quantitative
ducomplément appliquée
à l’étude du virus de la fièvreaphteuse.
Bull. Soc. Sci. Vét. LYON,67,1965,
243-69.Revue de Statistique Appliquée. 1970 - vol. XVIII N° 1
[6]
ROUMIANTZEFFM.,
FONTAINE J. et DUBOUCLARD C . - Evaluation dupouvoir immunogène
du virusaphteux
par mesure dupouvoir
fixant lecomplément après
traitement par un fluorocarbone. C.R. Acad. Sci.PARIS 261,
1965,
598-601.[7]
ROUMIANTZEFFM.,
et STELLMANN C. -Emploi
de méthodes auto-matiques
de fixation ducomplément
pour letitrage
desantigènes
vi-raux et des sérums
correspondants. Symposium Technicon, Européen -
Automatisation en chimie
analytique -
PARIS 2-4 Nov. 1966.[8]
LISON L. -Statistique appliquée
à labiologie expérimentale.
Laplani-
fication de