• Aucun résultat trouvé

Les trois indicateurs de santé présentés précédemment, l'indicateur des ATB,

l'indica-teur des SG sont issus de systèmes de recueil relativement stables dans sur la période

d'étude et semblent tous avoir une bonne représentativité. Cependant, l'indicateur

des IICP présente une stabilité de recueil moins able.

Dans la suite du mémoire, l'incidence mensuelle ou hebdomadaire (disponible pour

l'indicateur de l'exposition aux antibiotiques et pour l'indicateur des syndromes

grip-paux) de ces indicateurs est utilisée. La gure 2.3 présente l'évolution de l'indicateur

des IICP entre janvier 2002 et décembre 2009. La gure 2.4 présente l'évolution des

indicateurs des ATB et des SG de janvier 2000 à mars 2010. D'après ces graphiques,

certaines grandes caractéristiques de l'évolution de ces indicateurs sont notables.

L'in-dicateur des IICP présente une saisonnalité très nette, avec une augmentation

hiver-nale atteignant un pic autour du mois de janvier et un creux au mois d'aout. Cet

indicateur montre également une tendance à la hausse. L'indicateur des ATB est

éga-lement marqué par une saisonnalité avec la encore une augmentation hivernale avec

plusieurs pics et un creux au mois d'aout. Cet indicateur présente des changements de

niveau moyen suivant les périodes suivantes, juillet 2000 à juin 2002, juillet 2002 à juin

2005, juillet 2005 à juin 2008, juillet 2008 à mars 2010, comme décrit par Sabuncu et

al. [13] et Bernier et al. [14]. Nous parlerons alors de variation par palier. L'indicateur

des SG apparait là encore avec une saisonnalité marquée mais diérente de celle des

indicateurs précédents. En eet, les SG ont un prol épidémique, et cette épidémie

se produit seulement sur deux à trois mois. De plus, le début de l'épidémique varie

grandement dans le temps, avec un panel de mois compris entre septembre et mars.

32 2.5. Bilan

Temps (mois)

Incidence pour 100 000 habitants

Jan 2002 Jan 2003 Jan 2004 Jan 2005 Jan 2006 Jan 2007 Jan 2008 Jan 2009 Jan 2010

0 1 2 3 0 1 2 3

Incidence des méningites pour 1 000 000 habitants

Introduction de la T2A

Source : ATIH 2011 Pneumonies

Sépticémies Méningites

Figure 2.3 Incidence mensuelle des hospitalisations pour infections invasives à pneumocoques

pour 100 000 habitants en France entre 2002 et 2009 par pathologie (issue des données des PMSI).

Temps (mois)

Jan 2001 Jan 2002 Jan 2003 Jan 2004 Jan 2005 Jan 2006 Jan 2007 Jan 2008 Jan 2009 Jan 2010

0 100 200 300 400 500 0 1000 2000 3000 4000

Incidence des syndromes gr

ippaux (pour 100 000 habitants)

Nombre de remboursements pour antibiotique (x10,000)

Début de la campagne nationale

Data : CNAMTS, RSI and Sentiweb

Figure 2.4 Incidence pour 100 000 habitants des remboursements pour prescription d'antibiotique

(en noir) et des syndromes grippaux (en bleu) en France entre 2000 et 2010.

Chapitre 3

Bases méthodologiques

3.1 Introduction

Une série temporelle est une suite d'observations qui se distinguent par le rôle

im-portant que joue l'ordre dans lequel elles ont été recueillies. L'indice temporel peut

être la minute, le jour, le mois, etc. Ainsi, tout indicateur de santé recueilli à pas

de temps régulier peut être considéré comme une série temporelle, par exemple, la

mesure de la pollution atmosphérique à chaque heure d'une journée, la mesure de la

température d'un lieu chaque jour à la même heure [40]. Une série temporelle peut

également être une information agrégée sur une unité de temps, comme le nombre de

cas hebdomadaires de syndromes grippaux [38], la mesure mensuelle de la

consom-mation d'antibiotiques en France [13]. Ce type de données est fréquemment rencontré

dans le domaine de la surveillance en épidémiologie.

Modéliser des indicateurs de santé par des méthodes dites de séries temporelles c'est

déterminer le processus stochastique sous-jacent, générateur des données observées.

Cette modélisation permet de prévoir l'évolution de ces indicateurs, d'évaluer des

modications de comportement, d'évaluer l'impact d'une intervention ou de lier ces

indicateurs entre-eux [41,42].

34 3.1. Introduction

3.1.1 Notions de base des séries temporelles

L'analyse de séries temporelles est délicate, des notions spéciques ont été développées.

La première diculté des séries temporelles tient au fait qu'on n'observe qu'une seule

et unique valeur à chaque pas de temps. En statistique classique, on observe N

ob-servations à un temps donné. Si N est susamment grand, il est possible de faire des

inférences, c'est-à-dire à partir des observations, estimer les paramètres de la loi de la

variable aléatoire dont sont issues les observations. Or, ici, il est en eet impossible

d'obtenir plusieurs observations pour un même espace géographique, une même unité

de temps et une même population. En eet, dès qu'un de ces critères varie, le

proces-sus générateur des données varie. Les séries temporelles sont liées à la conjoncture de

l'unité de lieu et de temps dans lesquelles elles sont observées.

La seconde grande diculté des séries temporelles provient du fait que les données

sont corrélées entre-elles. En eet, il n'y a pas indépendance entre les observations

successives d'un indicateur temporel, l'analyse statistique classique ne peut pas être

mise en ÷uvre. La notion d'observations indépendantes et identiquement distribuées

est remplacée, dans l'analyse temporelle, par la notion de stationnarité qui implique,

au sens fort, la stabilité en loi du processus stochastique sous-jacent. La stationnarité

permet de supposer que les inférences faites à partir de données observées sont

va-lables pour les réalisations futures du processus générateur des données.

Ainsi, il est possible de modéliser un processus stationnaire, la section suivante en

donne le détail. Bien entendu, dans la réalité les séries temporelles étudiées ne sont

pas stationnaires. Une des grandes questions est de savoir par quelles méthodes elles

seront le mieux stationnarisées. Certaines de ces méthodes sont exposées dans la suite.

3.1.2 Régression entre plusieurs séries temporelles

Il existe deux grands types de méthodes permettant d'étudier l'association entre deux

ou plusieurs séries temporelles quand les erreurs sont supposées gaussiennes. Le

pre-mier type de modèles, développé par Box & Jenkins [43], correspond à la régression

dynamique. Le terme de régression dynamique combine à la fois la notion temporelle

d'une variable aléatoire et les eets de variables explicatives. Une telle régression est

utilisable à partir du moment où la série est susamment longue (au-moins 50

obser-vations) pour supporter un modèle avec une structure de corrélation interne. Box et

Jenkins ont étudié l'estimation des paramètres de modèles pour lesquels les

observa-tions sont supposées être générées par un processus stochastique uniquement.

Le second type de modèles correspond aux modèles de régression linéaire avec

er-reurs autocorrélées. Dans ces modèles, la matrice de variance-covariance des erer-reurs

est supposée ne comporter qu'un nombre susamment restreint de paramètres pour

être facilement estimée. Ce type de modèle est en fait un cas particulier des modèles

linéaires estimés par les moindres carrés généralisés. Judge et al. [25] ont étudié les

modèles supposant que les observations sont générées par la combinaison d'un

proces-sus déterministe et d'un procesproces-sus stochastique. Ces procesproces-sus stochastiques peuvent

être modélisés de diérentes façons, soit par un processus AutoRégressif (AR), soit

un processus moyenne mobile (MA), soit encore par un processus combinant les deux

précédents (ARMA). Cependant, les modèles les plus couramment utilisés en pratique

sont les modèles supposant des erreurs autorégressives (AR) car plus faciles à

implé-menter. Choudhury [44] retrace le développement de ces méthodes et tente de donner

aux praticiens les outils nécessaires pour faire un choix éclairé sur le modèle adéquat.

Il est à noter que les outils d'analyse de séries temporelles ont été développés dans

deux grands domaines, l'économétrie et le secteur industriel (les problématiques

-nancières sont particulièrement diérentes du reste). Certains termes et outils sont

spéciques à ces domaines, d'autres plus transversaux. Cependant, ces deux écoles de

pensée évoluent en parallèle. Dans le domaine de l'économétrie, on verra plus souvent

des modèles de régression linéaire, alors que dans le domaine de l'industrie, les

mo-dèles de Box et Jenkins seront préférés. Dans le domaine de la santé, ces deux grandes

écoles s'y retrouvent représentées avec la méthode de Box et Jenkins particulièrement

employée lorsqu'il s'agit d'étudier des relations hospitalières, et la régression linéaire

36 3.2. Étude d'une série temporelle