• Aucun résultat trouvé

Epidémiologie syndromique et détection d’anomalies

5.2 Matériel et méthodes

5.3.2 Etude globale des séries syndromiques

Le paragraphe ci-dessous décrit les résultats obtenus sur l‟ensemble des séries syndromiques, d‟abord concernant la modélisation des schémas temporels puis la détection de signaux avec les deux approches retenues. Les résultats sont comparés et analysés.

Modèles trigonométriques

Les caractéristiques des modèles obtenus pour les séries syndromiques sont résumées dans le Tableau XI. Le rapport entre les résidus de Pearson et la déviance résiduelle des modèles permet de calculer le paramètre de dispersion phi. Une valeur supérieure à 1 indique la présence de surdispersion et l‟inadéquation du modèle de Poisson simple.

Tableau XI : Résumé des paramètres des modèles trigonométriques des séries syndromiques 1, 3, 4, 5, 6 et 10.AIC = Critère d’Information d’Akaike. Phi = parameter de dispersion.

Série Nombre de termes de tendance Nombre de termes périodiques AIC Degrés de liberté Phi Syndrome 1 2 4 733 113 1,74 Syndrome 3 2 6 822 111 1,84 Syndrome 4 3 6 608 110 1,28 Syndrome 5 0 4 665 115 1,61 Syndrome 6 3 4 673 112 1,77 Syndrome 10 3 6 786 110 2,66

Toutes les valeurs de phi indiquent que les séries de données sont surdispersées car elles sont supérieures à 1, et il est donc nécessaire d‟en tenir compte dans le calcul des prédictions. En conséquence, les paramètres des modèles et leurs erreurs-type ont donc été ré-estimés avec une loi de quasi-Poisson.

Tous les syndromes, à l‟exception du syndrome 5, présentent des tendances sur les deux sous-périodes d‟étude, de nature polynomiale du second ou troisième degré. Les séries syndromiques et les tendances sont représentées dans la Figure 28.

Toutes les séries temporelles montrent une nette diminution cyclique du nombre de cas en été et une augmentation en automne-hiver-printemps. Cette augmentation présente plusieurs maxima (trois séries présentent deux maximas et trois séries en présentent trois) qui sont modélisés à l‟aide d‟un nombre correspondant de paramètres trigonométriques significatifs. Les courbes temporelles des séries 6 et 10 montrent une variation d‟amplitude plus forte et une périodicité moins évidente que les autres séries temporelles. Les causes possibles de ces constatations sont discutées plus loin. Les tendances mises en évidence pour les différents syndromes sauf le syndrome 5 (pas de tendance), dépendent de la période étudiée. Toutes montrent une augmentation vers la fin de 1996. Après 2002, les tendances des syndromes 1, 4, 6 et 10 montrent une augmentation, forte pour les syndromes 4 et 6, tardive pour le syndrome 10 et faible pour le syndrome 1. Le syndrome 3 montre plutôt une tendance à la diminution

Syndrome 1 nom bre de c as 0 20 40 60 80 100 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007 Syndrome 3 nom bre de c as 0 20 40 60 80 100 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007 Syndrome 4 nom bre de c as 0 5 10 15 20 25 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007 Syndrome 5 nom bre de c as 0 10 20 30 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007 Syndrome 6 nom bre de c as 0 10 20 30 40 50 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007 Syndrome 10 nom bre de c as 0 20 40 60 80 100 120 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007

Figure 28 : Séries temporelles observées (lignes pleines accidentées) et prédites par les modèles (lignes en pointillés) des syndromes 1, 3, 4, 5, 6 et 10 par mois. La zone blanche verticale révèle la discontinuité dans les séries temporelles. Les courbes lissées (traits pleins) indiquent les tendances pour les deux sous-périodes. Les échelles des ordonnées sont établies en fonction du nombre de cas et varient d’un syndrome à l’autre.

Chapitre 5

Détection d’anomalies

La détection de signaux a été conduite sur toutes les séries syndromiques ainsi que sur le jeu de données total avec les deux méthodes présentées dans l‟article 4. Les signaux ont été filtrés

a posteriori pour ne conserver que ceux correspondant à un excès de cas au moins égal à un.

Les signaux retenus sont présentés dans la Figure 29 et résumés dans le Tableau XII.

Tableau XII : Résumé du nombre de signaux (ou épisodes de signaux) produits par syndrome par les deux méthodes de détection.

Série Modèle trigonométrique Farrington Nombre de signaux concordants Total Ensemble 5 3 3 5 Syndrome 1 2 2 2 2 Syndrome 2 4 5 3 6 Syndrome 3 6 4 4 6 Syndrome 4 5 6 4 7 Syndrome 5 4 3 2 5 Syndrome 6 4 4 3 5 Syndrome 8 6 4 4 6 Syndrome 10 5 3 2 6

Globalement, dans notre étude portant sur 10 ans, chaque série syndromique a révélé deux à sept épisodes d‟anomalies. En moyenne pour l‟ensemble des syndromes, 4,8 signaux annuels sont produits. Des essais avec des seuils de détection supérieurs à 95% et à 99,5% n‟ont pas modifié le nombre de signaux retenus après filtrage.

Les signaux (ou épisodes de signaux consécutifs) produits par les deux méthodes se superposent dans 58% des 48 alertes. Dix signaux sont détectés par des modèles trigonométriques seulement entre 1993 et janvier 1996, période pendant laquelle aucun signal ne peut être produit par la méthode de Farrington. Pendant la période de février 1996 à 2007, la proportion de concordance des signaux est 70%.

Syn d ro me s 1993 1994 1995 1996 2002 2003 2004 2005 2006 2007 0 1 2 3 4 5 6 8 10

Figure 29 : Signaux détectés sur toutes les séries temporelles syndromiques. « 0 » représente le jeu de données total. Les triangles représentent les signaux issus de la méthode de Farrington et les losanges ceux des modèles trigonométriques. Rappel : le syndrome 10 regroupe les cas des classes 7 et 9.

Chapitre 5

La modélisation trigonométrique permet de détecter des signaux sur toute la période d‟étude. La méthode de Farrington est plus sensible aux variations de tendance à court terme [109] et six signaux sont produits par la méthode de Farrington seule pendant les 2,5 dernières années d‟étude.

L‟analyse du jeu de données complet A (Syndrome « 0 ») à révélé cinq épisodes d‟excès de cas sur les 120 pas de temps étudiés, soit : novembre 93, janvier 96, septembre-décembre 96, janvier-juin 06 et juillet 07. La comparaison de ces signaux avec ceux des séries syndromiques montre que :

- tous les signaux du jeu total correspondent à des signaux présents également pour plusieurs autres syndromes : en novembre 93 les syndromes 2, 6 et 10 ; en janvier 96 les syndromes 3 et 10 ; en septembre à décembre 96 les syndromes 1, 2, 5, 6, 8 et 10 ; en janvier à juillet 06 pour tous les syndromes sauf le 10 ; et en juillet 07 les syndromes 3, 4, 6 et 8 ;

- d‟autres signaux supplémentaires apparaissent spécifiquement pour certaines séries syndromiques, les plus longs étant : pour le syndrome 4 d‟août à octobre 2002, pour le syndrome 8 de janvier à mars 2003 et pour le syndrome 10 d‟octobre 2006 à avril 2007.

5.4 Discussion

Ce paragraphe discute les résultats de l‟étude globale des séries syndromiques, concernant la modélisation des séries qui ne sont pas présentées dans l‟article 4, puis la détection de signaux sur l‟ensemble des séries, dont certains sont interprétés à l‟aide des informations collectées dans la lettre SAGIR (voir description plus haut). La performance de l‟approche syndromique est également discutée au vu de ces résultats.

Saisonnalité et tendances

La saisonnalité apparente sur toutes les séries syndromiques est probablement fortement influencée par la variation annuelle du niveau d‟activité du réseau, mais correspond également aux caractéristiques épidémiologiques des principales causes de mort représentées par ces syndromes (voir 5.2.1 et article 4).

Les courbes temporelles de séries 6 et 10 semblent plus hétérogènes que les autres. En effet, le syndrome 6 correspond aux cas traumatiques ; leur survenue ainsi que leur collecte sont vraisemblablement plus aléatoires que ceux des autres causes de mort, induisant une forte variabilité des effectifs sans cyclicité stable. De même, les schémas temporels du syndrome 10 ont évolué dans le temps. Ceci peut être dû à un changement des caractéristiques épidémiologiques de l‟EBHS, mais également à la sous-déclaration grandissante des cas au fur et à mesure que la maladie est devenue endémique en France [161, 162].

L‟augmentation globale des tendances de toutes les séries en 1996, sauf celle du syndrome 5, est en concordance à la fois avec la réactivation du réseau [3], l‟émergence du phénomène dénommé « mortalité anormale du chevreuil » [3], et une épidémie d‟EBHS [163]. Les deux dernières causes de maladies ont augmenté le nombre de cas plus particulièrement des syndromes 1, 5, 8 et 10 en lien avec le lièvre, et des syndromes 2 et 6 (et 4 dans une moindre mesure) en lien avec le chevreuil, et dans lesquels on retrouve ces étiologies. Par ailleurs, la série regroupant l‟ensemble des cas (série « 0 ») indique une anomalie à cette période.

Tous les syndromes sauf le 3 et le 5 présentent une augmentation en fin de la période d‟étude 2002-2007. Elle est partiellement en rapport avec l‟augmentation du nombre de cas d‟oiseaux analysés à la suite de l‟émergence de l‟influenza aviaire HP H5N1 dans la Dombes [6, 130],

sauf pour le syndrome 10, qui comporte peu de cas d‟oiseaux, et signe quant à lui une augmentation des cas d‟EBHS en 2007.

Le syndrome 5 ne montre pas de tendance particulière ; comme il représente en partie les maladies respiratoires bactériennes des mammifères, sa stabilité pourrait être mise en rapport avec les constatations de Lamarque concernant la pasteurellose [138].

Signaux des séries synromiques

Tous les syndromes, sauf le syndrome 10, présentent un épisode de signaux au début de 2006. Comme décrit ci-dessus, il coïncide avec une augmentation du niveau d‟activité du réseau concernant les oiseaux, accompagnée d‟une baisse du nombre de lièvres [130].

Le signal de d‟août à octobre 2002 du syndrome 4 est caractérisé par plusieurs causes de mort dont certaines parmi les plus fréquentes de ce syndrome (infections respiratoires, entérotoxémies, encéphalites) ; la « mortalité anormale du chevreuil » qui est mise en rapport avec ces affections par Lamarque [3], avait été mentionnée dans la lettre SAGIR en janvier et juillet 2002, puis à nouveau à partir de janvier 2003. L‟épisode de janvier à mars 2003 du syndrome 8 est décrit dans l‟article 4 et correspond à des diagnostics de tularémie et de yersiniose chez le lièvre, qui ont également été signalés par le réseau. L‟épisode d‟octobre 2006 à avril 2007 du syndrome 10 correspond à une augmentation significative des diagnostics d‟EBHS et de septicémie, surtout chez le lièvre, mais il y a également une augmentation du nombre d‟oiseaux ; des mortalités liées à l‟EBHS avaient été consignées dans la lettre SAGIR à partir de septembre 2006 ; la surmortalité des oiseaux reste inexpliquée, mais est peut être également la conséquence de la vigilance accrue en rapport avec l‟influenza aviaire.

L‟analyse du jeu de données total donne des indications sur les variations du niveau d‟activité du réseau, surtout en 1996 [3], 2006 et 2007 [6]. Les séries syndromiques fournissent cependant davantage de signaux, et leur analyse apporte des informations plus précises sur des évènements de mortalité inhabituelle.

Estimation de la performance de la détection de signaux

Dans les exemples étudiés, les signalements faits par les acteurs de terrain du réseau SAGIR qui correspondent à des signaux détectés, sont soit contemporains de l‟évènement en cours, soit plus précoces. Il est donc possible que les signaux détectés correspondent en fait à une activation du réseau suite à l‟alerte donnée par ailleurs.

La modélisation de la prévalence des syndromes est liée à la prévalence réelle, mais aussi au fonctionnement du réseau. Un signal est soit dû à une augmentation de la fréquence d‟un problème pathologique, soit à la variation du fonctionnement du réseau, soit à un aléa statistique. Comme nous ne disposions pas d‟une référence validée pour les signaux, il n‟a pas été possible de quantifier précisément les sensibilité, spécificité et valeur prédictive des méthodes sélectionnées.

Néanmoins, il reste possible d‟examiner la correspondance entre les signaux des séries syndromiques étudiées en exemple et les signalements des évènements de mortalité anormale liés aux maladies correspondantes. Pour le syndrome 2 (six maladies faisant l‟objet de signalements dans la lettre SAGIR), on compte neuf correspondances sur 34 épisodes signalés, soit 26,5%. Pour le syndrome 8 (quatre maladies faisant l‟objet de signalements), il y a six correspondances sur 26 signalements, soit 25%. Globalement, sur l‟ensemble des séries syndromiques et l‟ensemble des signalements (et quels que soient les problèmes pathologiques signalés), il y a 32 correspondances sur 82 signalements, soit 39%.

Chapitre 5

Il faut cependant considérer que : 1) des cadavres d‟animaux ne sont pas systématiquement soumis à une analyse de laboratoire lorsque des problèmes sanitaires sont rapportés par les partenaires départementaux du réseau, notamment lorsque la cause peut être présumé d‟après l‟aspect du cadavre ; 2) certains de ces phénomènes sont très localisés et conduisent éventuellement à l‟analyse par le réseau de seulement quelques cadavres qui ne peuvent pas être détectés par notre approche syndromique, alors qu‟ils sont rapportés dans le bulletin. L‟étude des deux exemples de syndromes a par ailleurs montré que quatre signaux (sur 12) ne concordaient pas avec des signalements. Parmi ceux-ci, deux correspondaient à une ou des maladies diagnostiquées, et ces évènements n‟ont pas été rapportés dans le bulletin. Les deux autres n‟ont pas pu être expliqués (cause de mort « indéterminée »). L‟un d‟eux a été produit par une seule méthode (modèle trigonométrique) et pourrait correspondre à l‟avènement du problème de surmortalité du chevreuil ou être considéré comme un aléa statistique, alors que l‟autre a été signalé par les deux méthodes et est probablement dû à un évènement non identifié (Syndrome 8, signal de juillet 2007 concernant les oiseaux et les cetartiodactyles avec des causes de mort indéterminées).

En termes de précocité, la comparaison de l‟approche syndromique avec l‟approche diagnostique est délicate. En effet, ces deux entités ne portent pas la même information et ne se superposent pas. Néanmoins, nous avons analysé les séries temporelles des diagnostics de « yersiniose » et de « tularémie », pour lesquels plus de 50% des cas de la base de données avaient une description lésionnelle, à l‟aide de la méthode de Farrington. En effet, il n‟était pas possible de faire une étude avec le modèle trigonométrique en raison du faible nombre de cas mensuels. Nous avons comparé les signaux obtenus à partir de ces deux séries temporelles avec les signaux de la série du syndrome 8. Les deux signaux de ce syndrome correspondant à des cas de yersiniose et/ou de tularémie étaient concordants avec des signaux des séries diagnostiques, ce qui était attendu car le syndrome 8 comporte la majorité des cas de ces deux maladies. Cependant, les signaux syndromiques étaient plus tardifs de 1 et 3 mois. Ceci peut être dû au fait qu‟une partie des cas de tularémie et de yersiniose (49 et 48% respectivement) étaient classés dans d‟autres syndromes à cause d‟un tableau lésionnel ou d‟une description différents, diminuant ainsi les effectifs dans ce syndrome. Par ailleurs, les séries diagnostiques comportaient sept signaux supplémentaires dont deux communs, non révélés dans l‟analyse du syndrome. La détection est généralement plus sensible lorsque le niveau de base des cas est faible [111], mais il faut garder à l‟esprit que les séries diagnostiques sont très variables au cours du temps et l‟interprétation des signaux doit être faite avec précaution.

Comme tous les cas sont classés à l‟aide de leur profil lésionnel, une épidémie d‟étiologie inconnue aurait produit un signal dans une des séries syndromiques étudiées (a condition qu‟elle ait un profil lésionnel univoque) [55], ce qui a d‟ailleurs peut être été le cas pour les signaux des syndromes 2 et 8 associés à la cause de mort « indéterminée ». De même, lorsqu‟un diagnostic étiologique est posé à la suite d‟un évènement signalé par l‟étude syndromique, les cas inclus dans cet évènement et n‟ayant pas de diagnostic pourraient bénéficier de cette information pour guider le choix d‟investigations diagnostiques plus poussées. L‟analyse syndromique pourrait alors apporter une information complémentaire pour préciser le diagnostic.

5.5 Résumé et synthèse

L‟objectif de ce chapitre était d‟étudier la faisabilité de la modélisation des schémas temporels et la détection d‟évènements sanitaires inhabituels à partir des syndromes définis dans le

chapitre précédent. Après la description des données syndromiques, nous avons identifié la période d‟étude comportant des données exploitables pour la modélisation des séries temporelles. Puis les critères expliqués dans la première partie de la thèse ont été utilisés pour déterminer le choix des méthodes d‟analyse à retenir pour notre étude. Nous avons mis en évidence des tendances et variations saisonnières, ainsi que des périodes d‟excès de cas par rapport à un « bruit de fond » attendu, sur les exemples des séries syndromiques étudiées. Nous avons confronté ces résultats à des informations collectées dans le bulletin du réseau SAGIR (la lettre SAGIR) ainsi que dans la littérature scientifique. Nous avons montré que l‟information dégagée par l‟analyse des cas répartis en syndromes est plus précise que celle obtenue à partir de la mortalité brute, mais difficilement comparable à celle issue des diagnostics étiologiques. Les apports attendus concernaient surtout la sensibilité et la précocité, en comparaison aux signalements du réseau et aux données diagnostiques. Nous n‟avons pas été en mesure d‟évaluer quantitativement ces deux aspects, par manque d‟une information de validation fiable. Cependant, le concept est applicable et montre un réel intérêt théorique et pratique, notamment en terme de robustesse, et pour prendre en compte des problèmes pathologiques (comme par exemple l‟effet de conditions de vie défavorables), qu‟il serait difficile de cerner autrement. A ce stade, il faudrait cependant apporter des améliorations sur la qualité et la représentativité des données, accélérer la transmission de celles-ci, et procéder à l'évaluation de la performance des méthodes de détection avec des données validées ; ces éléments sont discutés dans le chapitre suivant.

Chapitre 6

Chapitre 6