• Aucun résultat trouvé

nettoyage des données

L’enregistrement et la notification des données de surveillance peuvent présenter des erreurs. Les données doivent être nettoyées avant de pouvoir être analysées. Des procédures normalisées doivent donc être mises en place pour minimiser, identifier et corriger les entrées erronées dans les ensembles de données. Cela permet de s’assurer que les analyses de données produiront moins de résultats biaisés et plus de résultats interprétables; cela permet également de poser un regard critique sur le processus de collecte de données établiet de le réviser en continu. Le nettoyage des données est bien plus aisé dans le cadre des systèmes de surveillance avec données individuelles que dans le casdes systèmes de données agrégées, le premier type de système permettant d’évaluer et de corriger les problèmes liés aux données plus facilement. On préfèrera également les systèmes électroniques aux systèmes sur format papier, des contrôles de validation automatisés pouvant être intégrés aux systèmes électroniques. Les bases de données électroniques se prêtent également aisément aux requêtespour évaluer la qualité.

Afin de garantir la propreté des données, l’épidémiologiste devrait se conformer aux principes généraux suivants :

• Maximiser la qualité des données au moment de les recueillir et de les saisir ;

• Procéder à un examen systématique des données pour repérer les références manquantes, imprécises, contradictoires, mal classées, ainsi que les valeurs non plausibles et les doublons ; et

• Corriger les points de données erronés de façon systématique.

Premièrement, il est vital que l’épidémiologiste prenne des mesures pour maximiser la qualité au moment de recueillir et de saisir les données. À cette fin, il convient d’élaborer des modes opératoires normalisés (MON) pour la collecte, la saisie et l’examen des données à tous les échelons administratifs du programme de lutte contre la tuberculose (par exemple au niveau du district, de la province et au niveau national). Cela favorise une approche homogène pour la collecte et la saisie des données et permet de sensibiliser toutes les personnes prenant part au processus, à la question de la qualité des données.

Une fois les MON pertinents mis au point, il est essentiel de proposer des formations aux partenaires locaux et provinciaux, afin de présenter les MON, les réviser et de

AnAlyse des données individuelles de notificAtion decAs de tuberculose 59

Exemple:

Mesures garantissant l’utilisation de données de bonne qualité

Au Royaume-Uni de Grande Bretagne et d’Irlande du Nord, Public Health Eng-land administre un système de surveillance de la tuberculose sur le Web. Ce système est conçu pour maximiser la qualité des données au moment où ces dernières sont recueillies et saisies. Le nombre de champs de saisie de texte libres des écrans de saisie est limité et la plupart des champs comportent un menu déroulant permettant de s’assurer que des valeurs valides sont saisies.

Le système comporte également des contrôles automatiques de validation des données pour éviter les erreurs de saisie, par exemple la « date du premier symptôme » doit précéder la « date de la première consultation en clinique

», qui doit précéder la «date de mise en route du traitement ». De même, la « date de naissance » ne peut pas se situer dans le futur et les données relatives aux « résultats du traitement » pour les schémas thérapeutiques de la catégorie

« guérison » ou « traitement terminé » ne peuvent pas être enregistrées moins de six mois après la « date de notification ». Outre ces mesures, de nombreuses régions produisent des rapports de données trimestriels pour repérer et corriger les erreurs. Les incohérences entres les variables d’un même cas sont signalées et font l’objet d’un suivi auprès de la clinique où le cas est survenu.

renforcer les capacités pour la collecte et la gestion des données. Le fait de distribuer des manuels écrits ou des posters reprenant les MON à toutes les personnes participant à l’enregistrement et à la notification des données sur la tuberculose peut contribuer à favoriser leur mise en œuvre et en garantir l’application. Outre les MON, il est important que l’épidémiologiste s’assure que la base de données est paramétrée de façon à minimiser les erreurs de saisie des données.b Par exemple pour la saisie des données, les champs de saisie de texte libres devraient être réduits au minimum pour s’assurer que les valeurs saisies soient valides; ils peuvent être remplacés par des menus déroulants ou des fourchettes de valeurs. De la même façon, des règles de validation des données à intégrer à la base de données devraient être élaborées (par exemple date du diagnostic ≤ date de début du traitement). Enfin, l’épidémiologiste devrait veiller à ce que la base de données soit configurée de façon à ce qu’on ne puisse pas laisser vides des champs contenant des valeurs de données importantes. On peut recourir à des messages d’erreur empêchant les personnes préposées à la saisie des données de poursuivre avant que le champ ne soit dûment complété. L’épidémiologiste aura moins d’erreurs à corriger lors du nettoyage des données si l’on joue un rôle actif lors de ces différentes étapes.

b La double saisie des données n’est généralement pas recommandée pour les données individuelles de surveillance de la tuberculose.

Chapitre 2

60 Une fois que les données ont été saisies, l’épidémiologiste devrait traquer de façon systématique et approfondie les valeurs manquantes, inexactes, incohérentes, mal classées, non plausibles ou doubles. Il/elle devrait procéder à plusieurs contrôles pour repérer ce type de valeurs. Par exemple il/elle devrait vérifier si les mêmes sujets sont représentés à plus d’une reprise dans le système (c’est-à-dire vérifier qu’il n’y ait pas le même cas à double). Les réponses pour les variables catégorielles (par exemple le statut sur la base du frottis) devraient également être vérifiées pour s’assurer que les valeurs se limitent aux catégories spécifiées pour cette variable (c’est-à-dire positif, négatif ou pas de frottis pour la variable « statut sur la base du frottis »). De même, les fourchettes pour les variables continues (par exemple l’âge et le poids) devraient être examinées (en d’autres termes, il faut repérer les réponses qui sortent de l’intervalle normale ou admissible).

Enfin, les points de données devraient être contrôlés pour vérifier leur logique et leur cohérence (à titre d’exemple, un sujet ne peut pas être un homme et être enceinte; l’âge d’un patient devrait correspondre précisément à sa date de naissance).

Exemple:

Contrôle de la qualité des données

Le PNLT des Pays-Bas cherche activement à identifier les doublons au niveau national. Ils utilisent une combinaison recoupant la date de naissance, l’année du diagnostic et l’établissement de santé et, lorsque c’est nécessaire, également le sexe, le diagnostic et le code postal. Le personnel local est averti des doublons éventuels. Si le personnel local confirme une double saisie, l’équipe du centre de santé de la municipalité consolide les données et supprime les doublons.

La dernière étape permettant de s’assurer que les données sont nettoyées consiste, pour l’épidémiologiste, à corriger les points de données erronés de façon systématique. Des protocoles clairs devraient être mis sur pied pour expliquer comment traiter les données erronées. Des modes normalisés devraient être élaborés pour identifier et, le cas échéant, corriger les erreurs d’enregistrement lorsqu’elles surviennent. Par exemple pour vérifier que les points de données erronés ont été supprimés, toutes les données manquantes ou inexactes devraient être traitées dès qu’on les repère. Veuillez noter qu’une règle unique pour la gestion des données inexactes ou manquantes devrait être adoptée et appliquée à toutes les données. La procédure idéale commence avec le retour aux données sources (les données conservées à l’échelon local), afin de vérifier et corriger les saisies.

AnAlyse des données individuelles de notificAtion decAs de tuberculose 61

Il y a différentes façons de vérifier, d’identifier et de corriger les données manquantes ou erronées avant de se lancer dans l’analyse des données individuelles de surveillance. En faisant l’effort de nettoyer les données régulièrement, un plus grand nombre d’erreurs peut être repéré, et ce, plus rapidement que si la tentative se fait des mois (ou des années) après la collecte. De plus, le fait de procéder à des vérifications et des analyses régulières des données, de dispenser des formations spéciales sur l’assurance de la qualité des données, d’intégrer des contrôles de la qualité des données dans la supervision de routine et de respecter les MON pour la collecte des données et leur saisie, permet de s’assurer que le nombre d’erreurs est réduit au minimum et qu’elles sont faciles à corriger.