• Aucun résultat trouvé

Compte tenu des caractéristiques des méthodes de détection de cluster présentées pré­ cédemment, il est possible de sélectionner les méthodes les plus adaptées dans diffé­ rents contextes. Dans le cadre de cette thèse, l’objectif est de constituer un système de

surveillance épidémiologique passif et orienté vers l’alerte, donc fondé sur la réutilisation de données médicales qui ne seront disponibles que sous forme agrégée. Par ailleurs, la méthode choisie doit permettre de localiser le cluster détecté, et on considère une distribu­ tion de Poisson sous l’hypothèse nulle. En complément de ces contraintes, les méthodes envisageables seront comparées sur la base d’une même fenêtre de balayage.

FIG. 5 : Choix des méthodes de détection

On retiendra donc les méthodes suivantes pour les comparer sur simulations : • méthode de Kulldorff classique (32)

• méthode de Kulldorff par permutations (37) • méthode non conditionnelle de Poisson (33) • méthode de CUSUM circulaire (22)

4

Comparaison de méthodes sur simulations

Plusieurs méthodes prospectives de détection de clusters ont été proposées ces 20 der­ nières années. Certaines sont destinées à des cas d’usages précis, mais dans d’autres cas de figure plusieurs choix sont possibles. C’est par exemple le cas lorsque l’on s’at­ tend à ce que le nombre d’événements observés suivent une distribution de Poisson. La question se pose alors de savoir quelle méthode privilégier dans cette situation. A ce jour, aucune étude n’a évalué les performances de détection de ces méthodes dans des condi­ tions homogènes et sur des critères prenant en compte à la fois la capacité à détecter un cluster, mais aussi la précision spatiale de cette détection.

L’objectif de cette étude de simulation est de comparer les performances des méthodes prospectives de détection de cluster adaptées aux distributions de Poisson sur un même jeu de données simulé. Les indicateurs de performance utilisés devront prendre en compte la capacité à localiser précisément le cluster détecté.

4.1

Données simulées

Pour ce travail on utilisera les données simulées proposées par Kulldorff (2004) pour pro­ céder à des études de comparaison de la puissance de méthodes de détection de cluster (45). Ces données sont présentées de façon complète dans l’article correspondant, et nous ne décrirons ici que les données utilisées dans cette étude.

Les simulations sont produites à l’échelle des 176 codes postaux de la ville de New­York et de la population associée en 2002, soit un total de 8003510 habitants. Les données simulent le nombre de cas d’une pathologie hypothétique observés dans chaque zone associée à un code postal, chaque jour pendant une durée de 31 jours. Elles ont été générées sous l’hypothèse nulle, ainsi que sous plusieurs hypothèses alternatives corres­ pondant à 5 localisations de cluster différentes (nommées A à E), avec à chaque fois une version limitée à une unité spatiale et une autre en recouvrant plusieurs, ainsi que deux niveaux d’augmentation du risque au sein du cluster. Leur localisation peut être visualisée sur la figure 3. Tous les clusters apparaissaient au 31e jour. Sous l’hypothèse nulle, 9999 jeux de données ont été générés, et 1000 pour chaque hypothèse alternative.

Pour chaque jeu de données, le nombre de cas répartis aléatoirement entre les unités était de 3100 (soit 100 multiplié par le nombre de jours). Ce nombre de 100 par jour a été choisi de façon à refléter le nombre de cas observés dans le système de surveillance des urgences de la ville de New­York pour certains syndromes courants. Sous l’hypothèse nulle les cas étaient répartis entre les unités spatiales selon une probabilité dépendant uniquement de la population sous­jacente, c’est­à­dire que le risque était le même pour chaque individu. Sous les hypothèses alternatives, un risque relatif supérieur à un était appliqué aux populations résidant dans le cluster simulé le 31e jour, tandis que la proba­ bilité d’être affecté restait inchangée dans les autres unités et lors des jours précédents, puis les cas étaient répartis aléatoirement selon ces nouvelles probabilités.

FIG. 6 : Carte de localisation des clusters simulés. Les zones rouges correspondent aux clusters d’une unité spatiale, les clusters étendus couvrent, pour chaque localisation, la zone rouge ainsi que les unités spatiales adjacentes en orange.

ont été attribués de façon à garantir une puissance de 99 % pour un risque de première espèce fixé de 5 %, lorsque l’on cherche à détecter une différence significative entre le risque observé dans les unités spatiales du cluster et le risque sur le reste du territoire étudié, en utilisant une distribution de Poisson, avec des données ne couvrant qu’une seule journée et un total de 100 cas. Il en résulte que le risque relatif associé à chaque épidémie simulée varie entre les différentes localisations adoptées, en fonction de la po­ pulation sous­jacente. L’objectif de cette méthode est de permettre la comparaison des performances des méthodes en fonction de la taille et de la population du cluster. Ainsi, une différence de puissance observée en fonction des localisations ou tailles de cluster pour une méthode donnée ne résulte pas d’un gain de puissance associé à une popula­ tion plus importante, mais bien des propriétés de la méthode quand elle est confrontée à différents types de clusters. Pour fournir un risque relatif modéré, la même méthode a été utilisée avec une puissance de 90 %.

Il en résulte les caractéristiques suivantes pour les clusters simulés :

• A (1 unité spatiale (US)) : risque relatif (RR) élevé de 9,91 ; RR modéré de 4,47 • A (5 US) : RR de 4,47

• B (1 US) : RR élevé de 57,08 ; RR modéré non précisé • B (6 US) : RR de 5,02

• C (1 US) : RR élevé de 9,89 ; RR modéré non précisé • C (5 US) : RR de 4,93

• D (1 US) : RR élevé de 18,63 ; RR modéré non précisé • D (10 US) : RR de 3,24

• E (1 US) : RR élevé de 13,76 ; RR modéré non précisé • E (5 US) : RR de 4,62

Documents relatifs