Microbiologie prévisionnelle. Estimation du paramètre de croissance maximum à partir des données de l'appareillage BIOSCREEN

(1)

HAL Id: hal-02826684

https://hal.inrae.fr/hal-02826684

Submitted on 7 Jun 2020

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

Microbiologie prévisionnelle. Estimation du paramètre

de croissance maximum à partir des données de

l’appareillage BIOSCREEN

Jean-Pierre Gauchi

To cite this version:

Jean-Pierre Gauchi. Microbiologie prévisionnelle. Estimation du paramètre de croissance maximum

à partir des données de l’appareillage BIOSCREEN. [Rapport Technique] RT2001-5, 2001.

�hal-02826684�

(2)

Institut National de la Recherche Agronomique

Centre de Recherche de Jouy-en-Josas

Unité de Biométrie / Equipe MatRisq

Microbiologie prévisionnelle

Estimation du paramètre de croissance maximum

à partir des données de l’appareillage BIOSCREEN

Jean-Pierre Gauchi

Jean-Pierre.Gauchi@jouy.inra.fr

Rapport technique 2001-5, 185 pp.

(3)

Sommaire

Introduction

………...………..……...…

p. 4

Première Partie : Dénombrements

……….…

p. 6

I . Description des processus de dilution et du mode opératoire BIOSCREEN

……

p. 7

II. Estimation des variances des différentes sources d’erreur

………….…………..………..

p. 16

II.1 Estimation des variances d’erreur de pipetage

…….……….……….……….…

p. 16

II.2 Estimation des variances d’erreurs de comptage

……...…….……….…………..……...…

p. 19

II.3 Estimation des variances d’erreurs de manipulation

……...……….…

p. 20

III. Calcul et estimation de l’espérance et de la variance du nombre et de la

concentration de bactéries dans un tube D

₁

……….…….……..……

p. 22

III.1 Quelques formules fondamentales utiles

………….………..…….…..….….…

p. 23

III.2 Espérance et son estimation du nombre de bactéries dans un tube D

₁

…………

p. 26

III.3 Variance et son estimation du nombre de bactéries dans un tube D

₁

…….…..…

p. 31

III.4 Espérance et variance de la concentration en bactéries dans un tube D

₁

………

p. 36

IV. Etude de la sensibilité de la variance des estimations du nombre de bactéries

dans un tube D

₁

.……….…

p. 38

V. Calcul et estimation de l’espérance et de la variance du nombre et de la

concentration de bactéries dans les tubes D

₂

à

D

₈

……….…….…….…

p. 40

V.1 Tube D

₂

………..…….….….…..

p. 40

(4)

Deuxième Partie : Estimation du paramètre

µ

_max

………...…….…

p. 45

VI. Temps de détection

……….……….…

p. 45

VI.1 Les courbes Bioscreen

………..…….…………..……….….…

p. 45

VI.2 Calcul des temps de détection par régression inverse

………..………...…

p. 46

VI.3 Variances, intervalles de confiance et poids des temps de détection

……….….…

p. 47

VII. La méthode IDRLS

……….……….…

p. 49

VII.1 Principe de la méthode IDRLS

………..……...……….….…

p. 49

VII.2 Régression robuste avec l’algorithme IRLS

………..………...…

p. 50

VII.3 Détails de la méthode IDRLS

………..……….…

p. 53

VII.4 Algorithme de la méthode IDRLS

………. ……….….…

p. 57

VII.5 Etude empirique de la robustesse de la méthode IDRLS

………. …….………….….…

p. 58

VIII. Estimation du paramètre

µ

_max

par une méthode de moyenne des temps

de génération

……….……….…

p. 66

Troisième Partie : Résultats

……….…

p. 68

IX. Résultats en fonction du %NaCl

………..………

p. 69

X. Résultats en fonction du pH

………….………..…………

p. 80

Conclusion

………..………...………

p. 83

(5)

Annexes

…..…………..……….……….………

p. 86

Annexe 1 : Courbes BIOSCREEN %NaCl à partir des données E. Coli de l’ADRIA Quimper

Annexe 2 : Courbes BIOSCREEN %NaCl à partir des données Listeria de l’ADRIA Quimper

Annexe 3 : Courbes BIOSCREEN %NaCl à partir des données L.M 118 III et S. Enteridis

de l’ADRIA Quimper

Annexe 4 : Courbes BIOSCREEN %NaCl à partir des données Listeria de IPL

Annexe 5 : Courbes BIOSCREEN %NaCl à partir des données E. Coli ECF-187 de IPL

Annexe 6 : Courbes BIOSCREEN pH à partir des données E. Coli de l’ADRIA Quimper

Annexe 7 : Estimations des

µ

_max

obtenues à partir des données de l’ADRIA Quimper

Annexe 8 : Estimations des

µ

_max

obtenues à partir des données de l’IPL

(6)

Introduction

Ce rapport technique représente la contribution principale de l’équipe MatRisq de l’Unité de

Biométrie de Jouy-en-Josas au projet PREVIUS, sur l’année 2001. Il s’adresse principalement

aux microbiologistes de la cellule opérationnelle de ce projet. On rappelle que l’objectif majeur

de PREVIUS est la constitution d’une base de données sur la microbiologie prévisionnelle dans

le domaine des aliments. Cette base est renseignée à la fois par des données issues de la littérature

et des données issues d’expériences en laboratoire réalisées par les partenaires de PREVIUS

(ADRIA-Quimper, Institut PASTEUR de Lille, INRA de Lille, ENV de Maisons-Alfort, le

Groupe industriel Danone, la SOREDAB, le CTSCCV).

Le problème statistique principal qui nous intéresse ici est l’estimation (ponctuelle et par

intervalles de confiance) d’un paramètre particulier : « pente maximum de la courbe de

croissance bactérienne », paramètre noté

µ

max

. Pour atteindre cet objectif il nous faut dans un

premier temps résoudre le problème de l’estimation de la variance du nombre de bactéries

présentes dans un tube d’une solution bactérienne diluée. Ce travail fait l’objet de la première

partie de ce rapport, il met en jeu des données issues de comptages de colonies sur boites de Pétri

fournies par IPL.

Dans la deuxième partie de ce rapport on utilise des courbes de cinétique de croissance obtenues

avec l’appareillage BIOSCREEN (fournies par IPL et ADRIA-Quimper). Celui-ci permet de

réaliser rapidement des cinétiques de croissance bactérienne en tubes dilués et sur lesquels

l’évolution de cette croissance est suivie quasiment en continu par la mesure de la densité

optique. On expose et on compare plusieurs méthodes de régression avant d’en proposer une bien

adaptée à l’estimation de

dans un tel contexte. La troisième partie est consacrée aux résultats

des méthodes exposées dans les parties I et II appliquées aux micro-organismes Listeria

Monocytogenes, Escherichia Coli et Salmonella Enteridis.

max

(7)

Un avantage majeur du BIOSCREEN est qu’il permet d’étudier des conditions

environnementales de pH et d’activité de l’eau Aw variables. Ainsi, la suite attendue de cette

étude est l’élaboration de modèles dits secondaires (non linéaires au sens de la régression)

représentant l’évolution du

en fonction de ces conditions environnementales. Ces modèles

secondaires sont caractérisés par des paramètres cardinaux : pH

_min

, pH

_max

, pH

_opt

, Aw

_min

,

Aw

_max

, Aw

_opt

, T

_min

, T

_max

, T

_opt

dont les valeurs dépendent du micro-organisme étudié. Ce

travail fera l’objet d’un rapport ultérieur.

max

(8)

Première Partie : Dénombrements

L’objectif de cette partie est l’estimation (ponctuelle et par intervalles de confiance) du nombre et

de la concentration en bactéries dans un tube dilué, à partir de comptages de colonies sur boites

de Pétri. Les variances de ces nombres et concentrations nous permettront de disposer de poids à

affecter aux données intervenant dans les méthodes de régression de la deuxième partie.

La difficulté de ces estimations est due à l’existence de plusieurs sources d’erreur :

- erreurs de dilution (qu’on appellera aussi erreurs de pipetage),

- erreurs d’échantillonnage,

- erreurs de comptage des UFC (unités formant colonies) sur les boites de Pétri,

- erreurs humaines de manipulation, typiquement lors de l’étalement d’une petite quantité

de solution microbienne sur la boite de Pétri .

Les erreurs de dilution et d’échantillonnage jalonnent tout le processus de la préparation des

solutions bactériennes, depuis la préparation des solutions microbiennes primaires jusqu’à la

solution prête à étaler. Avant d’exposer les calculs statistiques (chap. III) il nous faut donc faire

une description détaillée du processus de dilution ainsi que du mode opératoire de l’appareillage

Bioscreen d’une part (chap. I), et expliquer comment obtenir des estimations des variances de ces

différents types d’erreur d’autre part (chap. II).

(9)

I . Description des processus de dilution et du mode opératoire Bioscreen

On décrit ci-après ces processus de dilution et ce mode opératoire à partir des informations

recueillies au sein du groupe de travail PREVIUS ; les aspects purement biologiques de l’étape 1

ne seront qu’évoqués. On introduit au fur et à mesure les notations pour les tubes et les volumes

qui nous seront utiles par la suite. Ce mode opératoire se décompose en sept étapes :

- étape 1 : préparation du tube primaire P,

- étape 2 : préparation du tube D

₁

,

- étape 3 : dénombrement dans le tube D

₁

,

- étape 4 : préparation des tubes D

₂

à D

₈

,

- étape 5 : ensemencement des microplaques,

- étape 6 : mesure de la densité optique en continu,

- étape 7 : calculs,

étapes que nous développons maintenant.

Etape 1 : préparation du tube primaire P

On part du stock d’une souche d’une espèce E (Listeria monocytogenes, E. Coli, …) conservé à –

80°C duquel on prélève une microbille d’inoculum que l’on place dans un tube rempli d’un

volume V

_P

de milieu nutritionnel BHI adapté, à température ambiante. Ce tube est mis en

incubation à une température T dépendant de l’espèce E, pendant une durée ∆t. Ensuite un

repiquage est effectué à p% et ce deuxième tube est mis à incuber à une température T’ pendant

une durée ∆t’. On obtient ainsi un tube primaire P de concentration C

_P

, correspondant à un

(10)

Les valeurs usuelles pour les différentes grandeurs (mais dépendant de l’espèce E) sont :

- V

_P

= 10 ml,

- T = 30°C,

-

∆t = 8 heures,

- p% = 1% ou 0.1%,

- T’ = 30°C,

-

∆t = 16 ou 24 heures,

- C

_P

≈ 10

9

bactéries/ml.

Remarque :

En réalité la valeur de C

_P

est très mal connue, elle peut différer largement de 10

9

bactéries/ml.

Etape 2 : préparation du tube D

₁

On remplit n tubes à essais avec V

₁

ml de BHI pour n

₁

d’entre eux (tubes T

₁

_{à Tn}

1

) et V

2

ml de

BHI pour les n

₂

_{autres (tubes Tn}

₁₊₁

à

_Tn

₁₊

_n

₂

). Ce faisant on fait des erreurs de pipetage quand on

place soit V

₁

ml, soit V

₂

ml dans les tubes. Ces erreurs, de nature aléatoire, sont évidemment

différentes selon les tubes mais leurs variances sont également différentes selon que l’on place V

₁

ou V

₂

: les volumes réels placés dans ces tubes lors d’une expérience donnée sont donc inconnus.

Ensuite, on pipette v

_P

ml dans le tube P que l’on place dans le tube T

₁

, le tube T

₁

devient le tube

: ce faisant on fait encore une

' 1

T

erreur de pipetage (on prélève en fait un volume inconnu proche

de v

_P

ml,) et une erreur d’échantillonnage (on prélève en fait un nombre de bactéries différent du

nombre attendu v

_P

/V

_P

). Notons d

_P

= v

_P

/(V

₁

+ v

_P

) le facteur de dilution. S’il y avait exactement N

_P

bactéries

dans P et s’il n’y avait pas d’erreurs on aurait maintenant dans

T

₁'

:

-

'

=

N

_P

v

_P

/V

_P

= C

_P

v

_P

bactéries,

1

T

N

- un volume de solution égal à

'

= V

₁

+ v

_P

,

1

T

V

- une concentration théorique (nombre de bactéries par ml) de

'

=

/

= C

_P

d

_P

.

1 T

C

' 1 T

N

' 1 T

V

(11)

On opère ensuite par dilutions en cascade. Raisonnons avec la valeur usuelle de 4 pour n

₁

. A

partir de

on pipette v

_T

que l’on place dans T

₂

où se trouvent déjà V

₁

ml de BHI, le tube T

₂

devient le tube

; puis de

on prélève v

_T

que l’on place dans T

₃

où se trouvent déjà V

₁

ml de

BHI, le tube T

₃

devient le tube

, et enfin de

on prélève v

_T

que l’on place dans T

₄

où se

trouvent déjà V

₁

ml de BHI, le tube dans T

₄

devient le tube

. En théorie

,

et

devraient

donc contenir maintenant un volume de BHI exactement égal à

= V

₁

+ v

_T

, (i = 2, 3, 4) en

négligeant le volume occupé par les bactéries dans les tubes, et de concentrations respectives

'

2

T

C

,

e

. En réalité, on fait à chaque cascade des erreurs de pipetage et d’échantillonnage. La

concentration réelle dans le tube T n’est donc pas C . Pour évaluer cette concentration on opère

comme à l’étape 3 ci-dessous.

' 1

T

' 2

T

₂' ' 3

T

₃' ' 4

T

₂'

T

₃'

T

₄' ' i T

V

' 3 T

C

t

4 _T4 ' 4 T

C

Les valeurs usuelles pour les différentes grandeurs sont :

- n = 11,

- V

₁

= 9 ml,

- n

₁

= 4,

- V

₂

= 5 ml,

- n

₂

= 7,

- v

_P

= 1 ml,

- v

_T

= 1 ml (c’est-à-dire une dilution au dixième),

-

,

et

= 10

7

_,

₁₀

6

_{et 10}

5

_{bactéries/ml, respectivement, si on suppose 10}

9

bactéries/ml dans le tube P.

' 2 T

C

' 3 T

C

' 4 T

C

(12)

Etape 3 : dénombrement dans le tube D

₁

On appelle maintenant le tube

le tube D

₁

, contenant un nombre inconnu de bactéries N

_D1

, un

volume inconnu V

_D1

=

et de concentration inconnue C

_D1

=

. Pour établir le dénombrement

N

_D1

on procède de la façon suivante. A partir de D

₁

on prélève v

₁

ml que l’on place dans un tube

D

_1a

contenant V

₁

ml de BHI, le tube D

_1a

devient le tube

. Puis à partir de

on prélève v

_a

ml

que l’on place dans un tube D

_1b

contenant V

₁

ml de BHI, le tube devient le tube

. La

concentration théorique dans le tube

est donc

= C

_D1

d

₁

d

_1a

si on note d

₁

et d

_1a

les facteurs

de dilution avec d

₁

= v

₁

/

(V

₁

+ v

₁

) et d

_1a

= v

_a

/(V

₁

+ v

_a

). Enfin, depuis

on prélève un volume v

_b

que l’on place, sans le diluer, dans un tube

(l’indice e pour ensemencement) duquel on prélève

indépendamment S fois v

_bs

ml (s = 1 ,…, S) qui servent à ensemencer indépendamment S boites

de Pétri. On dépose donc en théorie

=

v

_bs

bactéries sur chacune des S boites b

_1s

(l’indice

1 de b

_1s

fait référence au tube D

₁

). En opérant ainsi le microbiologiste espère déposer environ une

centaine de bactéries sur une boite compte tenu de la valeur supposée de 10

5 pour C

_D1

. Au bout

de la durée adéquate il compte visuellement sur chaque boite b

_1s

un nombre n

_1s

de colonies. Si

celles-ci ne sont pas trop chevauchées et si on fait l’hypothèse que chaque bactérie déposée

conduit à une colonie (on parle alors d’unité formant colonie UFC) alors n

_1s

est égal au nombre

de bactéries dans le volume

déposé sur la boite b

_1s

. Pour remonter à la concentration C

_D1

qui

l’intéresse vraiment, le microbiologiste calcule d’abord la moyenne

' 4

T

' 4 T

V

' 4 T

C

' 1a

D

1a' ' 1b

D

' 1b

D

' 1b D

C

' 1b

D

e

D

' 1b D

n

' 1b D

C

bs

v

1

n des comptages obtenus sur

les S boites puis obtient C

_D1

par C

_D1

=

n v d d

₁ _bs ₁ ₁_a

. On dispose parfois de plusieurs vraies

répétitions de tubes D

₁

(pour une souche donnée), c’est-à-dire de tubes D

₁

préparés

indépendamment à partir de la microbille. On verra au chapitre III comment ces répétitions nous

seront utiles.

Remarque

En réalité, comme pour les étapes 1 et 2 des erreurs de pipetage et d’échantillonnage jalonnent

tout ce procédé de dilution et des erreurs de manipulation entachent la procédure

(13)

d’ensemencement qui se fait manuellement à l’aide d’un même râteau utilisé séquentiellement

pour étaler un volume

v

_bs

sur une boites b

_1s

.

Les valeurs usuelles pour les différentes grandeurs sont :

- v

₁

= 1 ml,

- V

₁

= 9 ml,

- v

_a

= 1ml,

- v

_b

= 1 ml,

- v

_bs

= 0.1 ml,

- s = 1 à 5,

- n

1s

= on s’attend avec les valeurs précédentes à la valeur de 100 en supposant 10

9

bactéries/ml dans le tube primaire P.

La figure 1 schématise cette méthode de dénombrement d’un tube D

₁

.

boite 1

boite 2

boite s

D1

(VD1 = V1+ vt)

D1a -> D'1a

(V1 -> V1+v1)

D1b -> D'1b

(V1 -> V1+va)

De

(0 -> vb)

v1

va

vb

vb1

vb2

vbs

(14)

Etape 4 : préparation des tubes D

₂

à D

₈

Pour obtenir les tubes D

₂

à D

₈

on opère en cascade comme suit. On prélève v

₂

ml dans le tube D

₁

que l’on place dans le tube T

₅

où se trouvent déjà V

₂

ml de BHI (voir étape 2) : le tube T

₅

devient

le tube D

₂

. Puis du tube D

₂

on prélève v

₂

ml que l’on place dans le tube T

₆

où se trouvent déjà V

₂

ml de BHI (voir étape 2) : le tube T

₆

devient le tube D

₃

et ainsi de suite jusqu’au tube D

₈

. Une

valeur usuelle pour v

₂

est 5 ml (dilution au demi).

Sans erreur de pipetage ni d’échantillonnage la concentration en bactéries dans le tube D

_i

, pour i

= 2 à 8, serait de

, en notant d = v

₂

/(V

₂

+ v

₂

) le facteur de dilution. En général d = 1/2

donc

, pour i = 2 à 8.

i D D

C

d

C

i

=

1 i D D

C

i

=

1

(

1 /

2 )

Etape 5 : ensemencement des microplaques,

Une microplaque de BIOSCREEN est une plaque stérile en matière plastique et comportant 100

cupules (10 colonnes de 10). On dépose dans la première cupule de la première colonne v

_c

microlitres prélevés du tube D

₁

, puis v

_c

prélevés de D

₂

dans la deuxième cupule de cette première

colonne, etc … jusqu’à la huitième cupule de la première colonne où on dépose v

_c

prélevés de D

₈

.

Une valeur usuelle pour v

_c

est 350 µl (= 0.350 ml). Les deux dernières cupules de la colonne sont

remplies par un BHI non inoculé (témoin). On opère de la même façon pour les 9 autres

colonnes, sachant qu’il ainsi possible de faire varier une condition environnementale de colonne

en colonne. Par exemple, on peut imposer une variation du pH (ou de l’Aw) des solutions de la

colonne 1 à la colonne 10.

On peut placer deux microplaques dans l’appareil. On note que les microplaques vierges sont

rigoureusement identiques (même lot de fabrication très précise et de stérilisation commune) ce

qui fait évacuer l’hypothèse d’un effet de la plaque vierge, hypothèse qui ne sera plus toujours

valide quand on considérera plus loin les plaques ensemencées et en fin de croissance

bactérienne.

(15)

v2

D1

T5 -> D2

T11 -> D8

témoins

pH1 pH2

pH10

vc

v2

Figure 2 : Schéma du mode opératoire de la préparation des dilutions pour une plaque de BIOSCREEN.

Etape 6 : mesure de la densité optique en continu

L’appareil BIOSCREEN est basé sur le principe que la turbidité d’une solution bactérienne

s’accentue quand la croissance bactérienne augmente au cours du temps. Corrélativement la

densité optique de cette solution évolue. Des études antérieures nombreuses ont montré une

relation linéaire de pente positive entre la densité optique et la masse bactérienne (vivante ou

morte, la distinction ne pouvant se faire dans ces conditions) dans la cupule. La relation linéaire

n’est valable que pour certaines gammes de concentration bactérienne, typiquement de 10

5

_{à 10}

9

bactéries/ml ce qui est le cas des études réalisées ici.

Les paramètres usuels du BIOSCREEN sont : température de 30°C, régulée avec précision,

longueur d’onde de 600 nm, intervalle entre deux mesures optiques de 15 minutes. Avant la

(16)

Etape 7 : calculs

Dans ce rapport on part des deux méthodes de calcul utilisées couramment par les

microbiologistes que l’on compare et que l’on améliore grâce à un point de vue statistique que

l’on développe dans la deuxième partie. On se contente ici de donner le principe de ces deux

méthodes appelées méthode de la droite de régression ordinaire et méthode de la moyenne des

temps de génération (Tg).

méthode de la droite de régression

Le principe est de calculer une droite de régression aux moindres carrés ordinaires des

logarithmes de concentration en inoculum dans les huit tubes en fonction des huit temps de

détection repérés sur les courbes de densité optique fournies par le Bioscreen (voir Figure 3). La

pente de cette courbe fournit l’opposé du µ

_max

cherché. Aucun intervalle de confiance n’est

fourni.

méthode de la moyenne des Tg

On détermine sept temps de génération pour huit courbes en calculant les différences entre deux

temps de détection. Comme on a la relation Tg = Log

_e

2 /

µ

_max

on en déduit sept valeurs possibles

pour µ

_max

dont on fait la moyenne par la suite. En réalité on verra que les valeurs aberrantes sont

souvent fréquentes parmi les huit valeurs et donc influencent fortement le µ

_max

moyen ainsi

(17)

t e m p s

t 1 t 2 t 3 t 8

T g 1 T g 2

D 1 D 2 _{D 8}

D O

Figure 3 : Schéma de principe d’obtention des temps de détection t

_i

et des temps de génération Tgi sur les

courbes de densité optique en fonction du temps, issues du Bioscreen.

(18)

II . Estimation des variances des différentes sources d’erreurs

Pour mener à bien nos calculs statistiques ultérieurs nous aurons besoin d’estimation des

variances des erreurs des sources d’erreurs signalées plus haut. Ces estimations ont été possibles

grâce à des données expérimentales et des informations fournies par les microbiologistes. Les

erreurs d’échantillonnage liées à la nature de la loi de probabilité attachée au prélèvement (loi

binomiale) seront examinées au chapitre III.

II .1 Estimation des variances d’erreurs de pipetage

Dans le cadre de cette étude les microbiologistes de l’IPL nous ont fourni plusieurs répétitions de

pipetées pesées avec une balance de grande précision (tableau 1).

Opérateur 1

Pipetée de 0.1 ml

Pipetée de 1 ml

Pipetée de 5 ml

Pipetée de 9 ml

0.1000 0.98 5.02

8.97 0.0929 1.00 5.04

8.97 0.1019 0.98 5.00

_8.97

0.0928 0.99 4.99

_9.02

0.1000 1.00 4.98

9.00 0.1000 0.99 4.99

9.02 0.0971 1.00 5.00

_9.03

0.0990 0.99 5.01

_9.04

0.1051 1.00 4.98

9.01 0.0997 1.00 4.96

9.02 Moyenne = 0.0989

Variance = 1.4224×10

-5

Moyenne = 0.993

Variance = 6.7778×10

-5

Moyenne = 4.997

Variance = 5.1222×10

-4

Moyenne = 9.005

Variance = 6.9444×10

-4

Opérateur 2

0.1256 1.02 5.02

0.0982 1.01 4.99

0.0959 1.00 5.00

0.0848 1.01 5.02

0.1127 1.00 4.99

0.1017 1.01 4.99

0.1130 1.01 5.02

0.0826 1.00 5.00

0.1019 1.00 4.99

0.1082 1.00 5.00

Moyenne = 0.10246

Variance = 1.7225×10

-4

Moyenne = 1.006

Variance = 4.8889×10

-5

Moyenne = 5.002

Variance = 1.7333×10

-4

Tableau 1 : pesées en grammes de différentes pipetées (les densités des solutions pipetées sont considérées

(19)

Ces données nous ont permis d’estimer des variances de pipetage comme on le montre

maintenant.

Pour les pipetées de 0.1, 1 et 5 ml nous avons testé au préalable l’égalité des variances des deux

échantillons (opérateurs 1 et 2) par un test usuel de Fisher-Snedecor (test F) au risque de première

espèce de 5%.

Estimation de la variance d’une pipetée d’un volume souhaité de 0.1 ml

Les variances des deux échantillons de pipetées de 0.1 ml, notées q

_0.1

, figurant au tableau 1, sont

déclarées significativement différentes au moyen du test F : les résultats de l’opérateur 2 sont plus

dispersés que ceux de l’opérateur 1. Mais comme dans la suite de l’expérience BIOSCREEN on

ne sait pas quel opérateur exécute telle ou telle pipetée (ce n’est pas forcément toujours le même

opérateur qui prépare toutes les solutions d’une expérience BIOSCREEN) on prendra comme

estimation de la variance de la pipetée q

_0.1

la valeur 9.18963×10

-5

_{obtenue en calculant la}

variance des données des deux échantillons réunis. On prendra comme estimation de l’espérance

la valeur cible de 0.1 ml.

Donc :

1 .

0 )

(

ˆ

1 . 0

=

q

E

5 0.1

ˆ (

)

9.18963 10

V q

=

×

−

.

Estimation de la variance d’une pipetée d’un volume souhaité de 1 ml

Les variances des deux échantillons de pipetées q

₁

ne sont pas déclarées significativement

différentes par le test F : les résultats de l’opérateur 2 présentent une dispersion comparable à

ceux de l’opérateur 1. On choisira comme estimation de la variance de la pipetée de 1 ml la

valeur 9.9737×10

-5

_{obtenue en calculant la variance des données des deux échantillons réunis.}

On prendra comme estimation de l’espérance la valeur cible de 1 ml.

Donc :

(20)

Estimation de la variance d’une pipetée d’un volume souhaité de 5 ml

Les variances des deux échantillons de pipetées q

₅

ne sont pas déclarées significativement

différentes par le test F : les résultats de l’opérateur 2 présentent une dispersion comparable à

ceux de l’opérateur 1. On choisira comme estimation de la variance de la pipetée q

₅

la valeur

3.3132×10

-4

_{obtenue en calculant la variance des données des deux échantillons réunis. On}

prendra comme estimation de l’espérance la valeur cible de 5 ml.

Donc :

5 )

(

ˆ

5

=

q

E

4 5

ˆ( ) 3.3132 10

V q

=

×

−

.

Estimation de la variance d’une pipetée d’un volume souhaité de 9 ml

On choisira comme estimation de la variance de la pipetée q

₉

la valeur 6.9444×10

-4

_{. On prendra}

comme estimation de l’espérance la valeur cible de 9 ml.

Donc :

9 )

(

ˆ

9

=

q

E

4 9

ˆ( ) 6.9444 10

V q

=

×

−

.

Estimation de la variance d’une pipetée d’un volume souhaité de 350

µ

l

D’après les microbiologistes la pipetée de 350 µl est connue à ± 0.3125 % (valeur obtenue par

interpolation linéaire à partir de volumes encadrants) ce qui nous conduit à un intervalle de

confiance approximatif (à 95%), exprimé en ml, de [ 0.34891 ; 0.35109 ] soit une variance

estimée pour une pipetée de 0.350 ml de :

(21)

2 7 0.350

0.35109 0.34891

ˆ (

)

3.0927 10

2 1.96

V q

=

⎛

_⎜

−

⎞

_⎟

=

−

×

⎝

⎠

×

On prendra comme estimation de l’espérance la valeur cible de 0.350 ml.

Donc :

35 .

0 )

(

ˆ

35 . 0

=

q

E

7 0.35

ˆ(

)

3.0927 10

V q

=

×

−

.

On récapitule ces résultats dans le tableau 2.

Pipetée

_E

ˆ

_V

ˆ

0.1

q

0.1

5

9.18963 10

×

− 1

q

1

5

9.9737 10

×

− 5

q

5

4

3.3132 10

×

− 9

q

9

4

6.9444 10

×

− 0.35

q

0.35

7

3.0927 10

×

−

Tableau 2 : Estimations des espérances et des variances des pipetées.

II .2 Estimation des variances d’erreurs de comptage

L’erreur dont il est question ici est l’erreur faite en comptant les UFC sur la boite de Pétri. En

effet, les praticiens expérimentés de ces comptages recommandent que le nombre d’UFC sur une

boite de Pétri soit proche de 100 pour permettre un comptage facile et entaché de peu d’erreur. Il

arrive cependant que le nombre d’UFC sur le boite dépasse largement la valeur de 100 (par

exemple 200 ou 300) ce qui conduit au chevauchement plus ou moins partiel de quelques UFC et

donc à une erreur dans le comptage du nombre total d’UFC sur la boite.

(22)

estimation basée sur les informations fournies par ces praticiens, tout en envisageant trois cas

possibles :

- Dans la plage des 50-150 UFC on supposera une erreur de ±3 UFC correspondant à une

variance de comptage de 18 (estimation basée sur deux comptages, donc un seul degré

de liberté).

- Pour des nombres d’UFC supérieurs à 150 on supposera une erreur de ±6 UFC

correspondant à une variance de comptage de 72.

La variance d’erreur de comptage sera notée par la suite

V K% )

(

rs

où

K%

rs

désigne la variable

aléatoire associée au comptage sur une boite s ensemencée par une solution bactérienne préparée

à partir d’une répétition r , notée D

_1r

, d’un tube D

₁

.

II .3 Estimation des variances d’erreurs de manipulation

Ces erreurs, d’origine humaine, sont également très difficiles à apprécier. Elles proviennent

essentiellement du « geste » effectué pour étaler la solution sur la boite de Pétri : c’est

l’ensemencement. Ce geste peut être manuel, c’est la technique dite du râteau ; en outre, ce râteau

sert en général à ensemencer au moins deux boites ce qui peut propager encore une erreur sur le

comptage futur. Le geste peut également être effectué par un appareil qui dépose selon une

spirale la solution sur la boite de Pétri. A titre d’exemple, d’après les spécialistes, pour deux

boites ensemencées par étalement manuel à partir de solutions préparées selon le même protocole

(mais évidemment soumises à des erreurs de dilution et d’échantillonnage) on peut compter un

nombre d’UFC de 80 pour l’une et 120 pour l’autre. Pour les données disponibles on considérera

ainsi deux situations possibles :

- Dans la plage des 50-150 UFC on supposera une erreur de ±50 UFC correspondant à

une variance de comptage de 625 en supposant que les intervalles d’incertitude sont

assimilables à des intervalles de confiance à 95% et donc qu’ils recouvrent quatre

écart-types.

- Pour des nombres d’UFC supérieurs à 150 on supposera une erreur de ±62 UFC

correspondant à une variance de comptage d’environ 1000.

(23)

La variance d’erreur de comptage établie sur S boites sera notée par la suite

où

désigne la variable aléatoire associée aux comptages sur S boites chacune étant ensemencée par la

même solution bactérienne préparée à partir d’une répétition r d’un tube D

₁

. Cependant, les S

boites diffèrent également par les volumes

réalisations de la variable aléatoire

.

(

_r

)

V K%

K%

_r

bs

v

%

_bs

On étudiera au chap. IV la sensibilité des résultats à la variation des variances de tous ces types

d’erreur.

(24)

III. Calcul et estimation de l’espérance et de la variance du nombre et de la

concentration de bactéries dans un tube D

₁

Pour établir ces calculs et estimations il nous faut montrer :

-

comment les erreurs d’échantillonnage et de dilution se propagent depuis un tube D

_1r

,

une répétition d’un tube D

₁

, jusqu’au volume

v

bs

,

- et comment prendre en compte les erreurs détaillées au chap. II.

Pour l’établissement des formules nous aurons besoin de formules fondamentales bien connues

rappelées au §III.1. Notre approche sera semi-analytique dans le sens où les calculs seront

essentiellement basés sur des formules analytiques mises à part quelques simulations rendues

nécessaires dans les cas d’absence de formules exactes ou d’approximation médiocre.

Pour l’application numérique on utilisera les hypothèses numériques de variances du chap. II et

les données de comptage sur boites de Pétri du tableau 3.

Répétitions

D

_1r

Souche 1

(E. Coli)

Souche 2

(E. Coli)

Souche 3

(L.M.)

Souche 4

(L.M.)

du tube

D

₁

(1.08×10

9

_{) (1.26×10}

9

_{) 1.94×10}

9

_{) 1.41×10}

9

)

1 245 75

1150

(

?)

175 2 260

145 1210

(

?)

232 3 119

150 55

221 4 85

150 73

225 5 145

160

250

213 6 185

105

253

266 7 120 90

267

216 8 65

150

320

197 9 275

150

231

145 10 140 75 205 141

Moyenne 164

128

207

218 Ecart-type 74

33

94

27 Tableau 3 : Comptages moyens d’UFC (à partir de deux boites de Pétri) pour 4 souches et 10 répétitions de

tubes D

₁

par souche ; entre parenthèses apparaissent les concentrations supposées dans la microbille de la

souche, en bactéries/ml. NB : les valeurs 1150 et 1210 de la souche 3 étant suspectes ont été remplacées par la

moyenne des 8 autres valeurs.

(25)

Enfin, on supposera, comme habituellement dans ce type d’expérience, que les bactéries dans les

différents tubes sont en suspension et ne sont pas agrégées, hypothèse raisonnable si la dilution

dans un tube est assez grande.

III.1 Quelques formules fondamentales utiles

Espérance totale et variance totale

Pour une variable aléatoire Y conditionnée par les réalisations d’une variable aléatoire X

on rappelle que l’on a :

))

(

)

(

Y

E

Y

X

E

=

(1)

))

(

))

(

)

(

Y

V

E

Y

X

E

V

Y

X

V

=

+

. (2)

Espérance d’un quotient de variables aléatoires

Il est bien connu que l’espérance d’un quotient n’est pas égale, en général, au quotient des

espérances, tout particulièrement dans les cas où les variables aléatoires du numérateur et du

dénominateur suivent des lois uniformes sur [0 ;1] ou des gaussiennes centrées réduites.

Toutefois, dans les cas qui nous intéressent ici en supposant des lois gaussiennes de moyennes et

variances spécifiées, nous avons vérifié à chaque fois, par simulation, que l’approximation

suivante était tout à fait acceptable :

)

(

)

(

Y

E

X

E

Y

X

E

⎟

≈

⎠

⎞

⎜

⎝

⎛

. (3)

Variance d’un quotient de variables aléatoires

Pour deux variables aléatoires non indépendantes X et Y (Kendall & Stuart, 1976) on a:

(

)

3 4 2 2

)

(

)

,

cov(

)

(

2 ))

(

))

(

)(

(

))

(

)

(

Y

E

Y

X

E

Y

E

X

E

Y

V

Y

E

X

V

Y

X

V

⎟

≈

+

−

⎠

⎞

⎜

⎝

⎛

. (4)

(26)

Variance d’un produit de variables aléatoires indépendantes

peut écrire la variance

de leur

(5)

emarque :

obtient facilement la formule (5) en appliquant la définition de la variance sur le produit des h

(6)

(7)

←

ar exemple, pour deux variables aléatoires indépendantes X et Y on retombe sur la formule

2 2

Y

V

X

E

X

V

+

. (8)

Pour h variables aléatoires indépendantes X

_i

, i = 1,…, h on

V

_P

produit comme la somme de 2

h

- 1 termes. Les

C

1h

premiers termes sont constitués du produit de

la variance d’une variable aléatoire, notée

V , et du produit des carrés des espérances des h-1

_i

autres variables aléatoires, notées

E , les

i

2

C

termes suivants sont constitués du produit de deux

variances et du produit des espérances carrées des h-2 variables aléatoires, etc… et enfin le

dernier terme est constitué du produit des variances des h variables aléatoires. Chaque terme de la

somme globale est constitué de h éléments. On écrit :

h

{

}

∑

{

∏

}

∏

∑

∏

∑

= ∉ < < ∉ < ≠ =

+

⎥

⎦

⎤

⎢

⎣

⎡

⎟

⎠

⎞

⎜

⎝

⎛

×

+

=

− − − h i i i i j j i i i i i i i i j j i i i i i j j h i i P

V

E

V

E

V

E

V

h h h 1 , , 2 , 2 2 1 ₁ ₂ ₁ ₁ ₁ 1 2 1 2 1 2 1 2 1 K K

L

R

→

On

variables aléatoires, qui conduit à (6), qui elle-même se développe en (7), c’est-à-dire :

⎪⎭

⎪

⎬

⎫

⎪⎩

⎪

⎨

⎧

⎥

⎦

⎤

⎢

⎣

⎡

⎭

⎬

⎫

⎩

⎨

⎧

−

⎥

⎦

⎤

⎢

⎣

⎡

=

∏

= = 2 1 1 h i i h i i P

E

X

E

X

V

∏

= =

−

⎭

⎬

⎫

⎩

⎨

⎧

=

h i i h i i

E

X

E

1 2 1 2

{ }

_∏

∏

= =

−

=

h i i h i i P

E

X

E

V

1 2 1 2

∏

= =

−

+

=

h i i h i i i

E

V

1 2 1 2

)

(

P

exacte bien connue (Kendall & Stuart, 1976) :

(

)

(

)

(

)

(

XY

V

X

V

Y

E

Y

V

=

+

))

(

)

(

))

(

)

(27)

Variance d’un produit de variables aléatoires non indépendantes

man, 1962). On se contentera

On peut aussi établir une formule générale (voir par exemple Good

de donner ici la formule exacte pour deux variables aléatoires non indépendantes, formule qui

nous sera utile par la suite.

(

2 2

)

2 2

)

(

)

(

)

(

))

(

)

(

))

(

)

(

XY

E

Y

V

X

E

X

V

Y

E

X

Y

V

=

+

∆

(

)(

)

2 (

)

(

)

(

)

(

2 E

X

E

∆

X

∆

Y

2

+

E

Y

E

∆

X

2

∆

Y

+

2

2 ( ) ( )

E X E Y Cov X Y

( , )

Cov X Y

( , )

+

−

(9)

vec :

Cov(X,Y) la covariance entre X et Y.

On

b

ppant les termes de :

a

-

∆

X

=

X

−

E

( X

)

,

-

∆

Y

=

Y

−

E

( X

)

,

-

éta lit facilement cette formule en dévelo

{

2

}

))

(

)

(

XY

E

XY

E

XY

V

=

−

.

n remarque dans (9) la présence de moments mixtes centrés d’ordre 3 et 4.

a formule (9) se simplifie dans le cas où X et Y sont des variables gaussiennes. En effet, d’une

}

(

z

₃

E

z

₃

z

₄

E

z

₄

O

L

part les moments mixtes d’ordre 3 s’annulent et d’autre part, en dérivant la fonction

caractéristique d’une loi gaussienne conjointe de quatre variables aléatoires z

_i

, i = 1,…,4,

(Anderson, 1958), on a :

{

(

z

₁

E

(

z

₁

))(

z

₂

E

(

z

₂

))

E

−

(

))(

−

(

))

,

)

( ,

)

( ,

)

( ,

)

Cov z z Cov z z

=

+

ce qui conduit ici à :

)

−

1 2 3 4 1 3 2 4 1 4 3 4

( ,

)

( ,

)

(

2 2 2

(

) (

)

( ) ( )

2 ( ,

E

⎡

_⎣

∆

X

∆

Y

⎤

_⎦

=

V X V Y

+

Cov X Y

onc finalement (9) se simplifie en

D

(28)

III.2. Calcul de l’espérance et de son estimation du nombre de bactéries dans un tube D

₁

n rappelle que l’on note D

_1r

une répétition r , r = 1,…, R, d’un tube D

₁

, R prenant la valeur 10

otons :

-

O

dans cette étude.

N

1r

D

N%

la variable aléatoire « nombre de bactéries dans un tube D

_1r

»,

et

-

1

(

)

r D

E N%

1

(

)

r D

V N%

son espérance et sa variance respectives,

1

~

D

N la variable aléatoire «

nombre de bactéries dans un tube

D

₁

», )

(

~

1 D

N

E

et )

(

~

1 D

N

V

son

espé

-

colonies sur la boite

»,

an

une répétition D

_1r

d’un

tub

₁

n s’intéresse donc dans ce paragraphe au calcul et à l’estimation de

rance et sa variance respectives,

1rs

n

% la variable aléatoire « nombre de

b

1rs

-

n

%

_1r

la variable aléatoire « nombre de colonies correspond

t à

e D », E( n

% ) et V( n% ) son espérance et sa variance respectives,

_1r _1r

O

(

~

)

1 D

N

E

. Pour y parvenir on

.

ompte tenu des hypothèses postulées précédemment, la probabilité

d’avoir un nombre

rob

les

= Prob

s’intéressera dans un premier temps au calcul et à l’estimation de

%

1

(

)

r D

E N

C

P

₁_rs

n

₁_rs

de bactéries dans le dernier volume prélevé v s’exprime à l’aide des p

abilités conditionnel

des étapes de dilution (deux dans notre situation) et de l’étape finale de prélèvement. En partant

du dernier prélèvement et en remontant jusqu’au premier on peut écrire :

bs

1rs

P

(

n

1rs

∈

v n

bs 1rs

∈ )×Prob(

v

b

n

1rs

∈

v n

b 1rs

∈ )×Prob(

v

a

n

1rs

∈

v n

a 1rs

∈ )×Prob(

v

1

n

1rs

∈ )

v

1

(

11)

Chaque volume apparaissant dans (11) , ayant été prélevé par pipetage, est entaché d’une erreur

expérimentale ; il sera donc considéré comme la réalisation d’une variable aléatoire et en

(29)

conséquence la probabilité

est une réalisation de la variable aléatoire

. Alors, la variable

aléatoire

suit une loi Binomiale de paramètres aléatoires

1rs

P

P%

_1rs 1rs

n

%

1r D

N%

et

P%

_1rs

. On écrit :

1rs

n

% ∼ B(

1r D

N%

,

P%

_1rs

)

avec :

1rs

P%

=

bs b

v

×

%

~

₁

~

1 1 1 1 D a a b

V

v

V

v

V

v

_×

+

×

+

=

₁ 1 bs b a b D

v

d d

v

×

V

×

%

_{% %}

%

(12)

où

1 a a a

v

d

V

v

=

+

%

_%

et

1 1 1 1

v

d

V

v

=

+

%

_%

sont les facteurs (aléatoires) de dilution.

Les volumes pipetés sont surmontés d’un tilde pour souligner leur caractère aléatoire. Leurs

espérances et variances sont différentes mais restent constantes respectivement pour toutes les

répétitions D

_1r

du tube D

₁

et toutes les souches. On rappelle (voir étape 3 du chap. I) que la

formation du volume

v~ n’amène à aucune dilution mais cette manipulation conduit à une

_b

nouvelle erreur de pipetage.

Comme la variable aléatoire

n

%

₁_r

est conditionnée par

1r

D

N%

et

P%

_1rs

, on peut écrire d’après (1) que :

E(

n

%

1r

) =

E E n

( (

%

1r

N

%

D1r

,

P

%

1rs

))

(13)

et d’après la définition de l’espérance d’une loi binomiale il vient :

1 1 1

( (

,

))

r r D rs

E E n

%

N

%

P

%

=

1 1

(

r

)

D rs

E N

%

P

% (14)

Par ailleurs, on peut considérer que les deux variables aléatoires

1r D

N%

et

sont indépendantes

puisque :

1rs

P%

- d’une part le nombre de bactéries dans un tube D

_1r

dépend du nombre de bactéries

présentes dans la souche congelée et des erreurs de pipetage, indépendantes les unes des

autres, réalisées depuis le tube primaire jusqu’au tube D

_1r

,

(30)

Ainsi, on a pour chaque répétition D

_1r

:

1

(

_r

)

E n

_{% =}

( ) (

1r 1

)

D rs

E N

%

×

E P

%

(15)

=

( )

1r D

E N

%

×

1 1 bs b a b D

v

E

d

v

V

⎛

⎞

×

× ×

⎜⎜

⎝

⎠

%

_%

%

d

⎟⎟ (16)

=

( )

1r D

E N

%

×

1 bs b b D

v

E

v

V

⎛

⎞

×

⎜

⎟

⎜

⎟

⎝

⎠

%

)

~

(

)

~

(

d

E

d

₁

E

_a

×

(17)

puisque que les trois variables aléatoires

1 bs b b D

v

V

⎛

⎞

×

⎜

⎟

⎜

⎟

⎝

⎠

%

,

d

a

~

et

sont indépendantes, les volumes

ayant été pipetés indépendamment. On peut donc obtenir facilement une estimation de

l’espérance

à partir de (17) si on explicite les autres termes et que l’on dispose d’une

estimation de

.

1

~

d

(

D1r

E N%

)

1

(

_r

)

E n

%

Explicitation du terme

1 bs b b D

v

E

v

V

⎛

⎞

×

⎜

⎟

⎜

⎟

⎝

⎠

%

Compte tenu du processus de dilution c’est la même réalisation de la variable aléatoire

qui

intervient deux fois mais il nous faut considérer cependant que deux variables aléatoires quotients

non indépendantes constitue ce terme pour ne pas perdre l’information liée à la variance de

.

Donc on écrit :

b

v

%

b

v

%

1 bs b b D

v

E

v

V

⎛

⎞

×

⎜

⎟

⎜

⎟

⎝

⎠

%

=

1 1

cov

bs

,

b bs b b D b D

v

E

v

V

v

V

⎛

⎞

⎛

⎞

⎛

+

×

⎜

⎟

_⎜

_⎟

⎜

⎟

_⎝

_⎠

⎜

⎝

⎠

⎝

%

⎞

⎟⎟

⎠

%

(18)

On peut approximer les espérances des deux quotients de (18) en utilisant (3) après avoir vérifié

l’approximation (3) par simulation de lois gaussiennes, soit :

1 bs b b D

v

E

v

V

⎛

⎞

×

⎜

⎟

⎜

⎟

⎝

⎠

%

=

₁ ₁

(

)

( )

cov

,

( )

(

)

bs b bs b b D b D

v

E v

v

V

E v

E V

⎛

⎞

+

×

⎜

⎟

⎜

⎟

⎝

⎠

%

(19)

(31)

Pour l’estimation de cette espérance, on établira ci-dessous une estimation de la covariance par

simulation en supposant une distribution gaussienne pour les termes

v

%

_bs

,

v~ et

_b

1

~

D

V et en utilisant

les informations du tableau 2.

Application numérique :

En simulant pour les termes

v

%

_bs

,

v~ et

_b 1

~

D

V les lois gaussiennes respectives :

- N( moy = 0.1 ; var = 9.19×10

-5

_),

- N( moy = 1 ; var = 9.97×10

-5

_),

- N( moy = (9+1) ; var = (6.94×10

-4

_{+ 9.97×10}

-4

)),

on obtient :

1

ˆcov

bs

,

b b D

v

V

⎛

⎞

⎜⎜

⎝

⎠

%

⎟⎟ = -1.0×10

-6

_{, ce qui correspond à une corrélation d’environ –0.41,}

et donc à partir de (19) on a :

1

ˆ

bs b b D

v

E

v

V

⎛

⎞

×

⎜⎜

⎝

⎠

%

⎟⎟ = (-1.0×10

-6

_)+(0.1/1)

× (1/10) ≈ 0.01 . (20)

Explicitation des termes

E

(

d

~

_a

)

et

E

(

d

~

1

)

En simulant :

- pour

1

~

V

la loi gaussienne : N( moy = 9 ; var = 6.94×10

-4

),

- pour

~

v et

₁

v~ la loi gaussienne : N( moy = 1 ; var = 9.97×10

a

-5

),

on obtient les estimations :

1

ˆ

a a

v

E

V

v

⎛

⎞

⎜

₊

⎟

⎝

⎠

%

% %

≈

1

ˆ ( )

ˆ (

)

a a

E v

E V

+

v

%

% %

= 0.1

1 1 1

ˆ

v

E

V

v

⎛

⎞

⎜

₊

⎟

⎝

⎠

%

% %

≈

1 1 1

ˆ ( )

ˆ (

)

E v

E V

+

v

%

% %

= 0.1 (21)