Les trois indicateurs de santé présentés précédemment, l'indicateur des ATB,
l'indica-teur des SG sont issus de systèmes de recueil relativement stables dans sur la période
d'étude et semblent tous avoir une bonne représentativité. Cependant, l'indicateur
des IICP présente une stabilité de recueil moins able.
Dans la suite du mémoire, l'incidence mensuelle ou hebdomadaire (disponible pour
l'indicateur de l'exposition aux antibiotiques et pour l'indicateur des syndromes
grip-paux) de ces indicateurs est utilisée. La gure 2.3 présente l'évolution de l'indicateur
des IICP entre janvier 2002 et décembre 2009. La gure 2.4 présente l'évolution des
indicateurs des ATB et des SG de janvier 2000 à mars 2010. D'après ces graphiques,
certaines grandes caractéristiques de l'évolution de ces indicateurs sont notables.
L'in-dicateur des IICP présente une saisonnalité très nette, avec une augmentation
hiver-nale atteignant un pic autour du mois de janvier et un creux au mois d'aout. Cet
indicateur montre également une tendance à la hausse. L'indicateur des ATB est
éga-lement marqué par une saisonnalité avec la encore une augmentation hivernale avec
plusieurs pics et un creux au mois d'aout. Cet indicateur présente des changements de
niveau moyen suivant les périodes suivantes, juillet 2000 à juin 2002, juillet 2002 à juin
2005, juillet 2005 à juin 2008, juillet 2008 à mars 2010, comme décrit par Sabuncu et
al. [13] et Bernier et al. [14]. Nous parlerons alors de variation par palier. L'indicateur
des SG apparait là encore avec une saisonnalité marquée mais diérente de celle des
indicateurs précédents. En eet, les SG ont un prol épidémique, et cette épidémie
se produit seulement sur deux à trois mois. De plus, le début de l'épidémique varie
grandement dans le temps, avec un panel de mois compris entre septembre et mars.
32 2.5. Bilan
Temps (mois)
Incidence pour 100 000 habitants
Jan 2002 Jan 2003 Jan 2004 Jan 2005 Jan 2006 Jan 2007 Jan 2008 Jan 2009 Jan 2010
0 1 2 3 0 1 2 3
Incidence des méningites pour 1 000 000 habitants
Introduction de la T2A
Source : ATIH 2011 Pneumonies
Sépticémies Méningites
Figure 2.3 Incidence mensuelle des hospitalisations pour infections invasives à pneumocoques
pour 100 000 habitants en France entre 2002 et 2009 par pathologie (issue des données des PMSI).
Temps (mois)
Jan 2001 Jan 2002 Jan 2003 Jan 2004 Jan 2005 Jan 2006 Jan 2007 Jan 2008 Jan 2009 Jan 2010
0 100 200 300 400 500 0 1000 2000 3000 4000
Incidence des syndromes gr
ippaux (pour 100 000 habitants)
Nombre de remboursements pour antibiotique (x10,000)
Début de la campagne nationale
Data : CNAMTS, RSI and Sentiweb
Figure 2.4 Incidence pour 100 000 habitants des remboursements pour prescription d'antibiotique
(en noir) et des syndromes grippaux (en bleu) en France entre 2000 et 2010.
Chapitre 3
Bases méthodologiques
3.1 Introduction
Une série temporelle est une suite d'observations qui se distinguent par le rôle
im-portant que joue l'ordre dans lequel elles ont été recueillies. L'indice temporel peut
être la minute, le jour, le mois, etc. Ainsi, tout indicateur de santé recueilli à pas
de temps régulier peut être considéré comme une série temporelle, par exemple, la
mesure de la pollution atmosphérique à chaque heure d'une journée, la mesure de la
température d'un lieu chaque jour à la même heure [40]. Une série temporelle peut
également être une information agrégée sur une unité de temps, comme le nombre de
cas hebdomadaires de syndromes grippaux [38], la mesure mensuelle de la
consom-mation d'antibiotiques en France [13]. Ce type de données est fréquemment rencontré
dans le domaine de la surveillance en épidémiologie.
Modéliser des indicateurs de santé par des méthodes dites de séries temporelles c'est
déterminer le processus stochastique sous-jacent, générateur des données observées.
Cette modélisation permet de prévoir l'évolution de ces indicateurs, d'évaluer des
modications de comportement, d'évaluer l'impact d'une intervention ou de lier ces
indicateurs entre-eux [41,42].
34 3.1. Introduction
3.1.1 Notions de base des séries temporelles
L'analyse de séries temporelles est délicate, des notions spéciques ont été développées.
La première diculté des séries temporelles tient au fait qu'on n'observe qu'une seule
et unique valeur à chaque pas de temps. En statistique classique, on observe N
ob-servations à un temps donné. Si N est susamment grand, il est possible de faire des
inférences, c'est-à-dire à partir des observations, estimer les paramètres de la loi de la
variable aléatoire dont sont issues les observations. Or, ici, il est en eet impossible
d'obtenir plusieurs observations pour un même espace géographique, une même unité
de temps et une même population. En eet, dès qu'un de ces critères varie, le
proces-sus générateur des données varie. Les séries temporelles sont liées à la conjoncture de
l'unité de lieu et de temps dans lesquelles elles sont observées.
La seconde grande diculté des séries temporelles provient du fait que les données
sont corrélées entre-elles. En eet, il n'y a pas indépendance entre les observations
successives d'un indicateur temporel, l'analyse statistique classique ne peut pas être
mise en ÷uvre. La notion d'observations indépendantes et identiquement distribuées
est remplacée, dans l'analyse temporelle, par la notion de stationnarité qui implique,
au sens fort, la stabilité en loi du processus stochastique sous-jacent. La stationnarité
permet de supposer que les inférences faites à partir de données observées sont
va-lables pour les réalisations futures du processus générateur des données.
Ainsi, il est possible de modéliser un processus stationnaire, la section suivante en
donne le détail. Bien entendu, dans la réalité les séries temporelles étudiées ne sont
pas stationnaires. Une des grandes questions est de savoir par quelles méthodes elles
seront le mieux stationnarisées. Certaines de ces méthodes sont exposées dans la suite.
3.1.2 Régression entre plusieurs séries temporelles
Il existe deux grands types de méthodes permettant d'étudier l'association entre deux
ou plusieurs séries temporelles quand les erreurs sont supposées gaussiennes. Le
pre-mier type de modèles, développé par Box & Jenkins [43], correspond à la régression
dynamique. Le terme de régression dynamique combine à la fois la notion temporelle
d'une variable aléatoire et les eets de variables explicatives. Une telle régression est
utilisable à partir du moment où la série est susamment longue (au-moins 50
obser-vations) pour supporter un modèle avec une structure de corrélation interne. Box et
Jenkins ont étudié l'estimation des paramètres de modèles pour lesquels les
observa-tions sont supposées être générées par un processus stochastique uniquement.
Le second type de modèles correspond aux modèles de régression linéaire avec
er-reurs autocorrélées. Dans ces modèles, la matrice de variance-covariance des erer-reurs
est supposée ne comporter qu'un nombre susamment restreint de paramètres pour
être facilement estimée. Ce type de modèle est en fait un cas particulier des modèles
linéaires estimés par les moindres carrés généralisés. Judge et al. [25] ont étudié les
modèles supposant que les observations sont générées par la combinaison d'un
proces-sus déterministe et d'un procesproces-sus stochastique. Ces procesproces-sus stochastiques peuvent
être modélisés de diérentes façons, soit par un processus AutoRégressif (AR), soit
un processus moyenne mobile (MA), soit encore par un processus combinant les deux
précédents (ARMA). Cependant, les modèles les plus couramment utilisés en pratique
sont les modèles supposant des erreurs autorégressives (AR) car plus faciles à
implé-menter. Choudhury [44] retrace le développement de ces méthodes et tente de donner
aux praticiens les outils nécessaires pour faire un choix éclairé sur le modèle adéquat.
Il est à noter que les outils d'analyse de séries temporelles ont été développés dans
deux grands domaines, l'économétrie et le secteur industriel (les problématiques
-nancières sont particulièrement diérentes du reste). Certains termes et outils sont
spéciques à ces domaines, d'autres plus transversaux. Cependant, ces deux écoles de
pensée évoluent en parallèle. Dans le domaine de l'économétrie, on verra plus souvent
des modèles de régression linéaire, alors que dans le domaine de l'industrie, les
mo-dèles de Box et Jenkins seront préférés. Dans le domaine de la santé, ces deux grandes
écoles s'y retrouvent représentées avec la méthode de Box et Jenkins particulièrement
employée lorsqu'il s'agit d'étudier des relations hospitalières, et la régression linéaire
36 3.2. Étude d'une série temporelle
Dans le document
Usage des anti-infectieux et infections invasives à pneumocoque en France, étude d'associations temporelles
(Page 54-59)