• Aucun résultat trouvé

Chapitre 6 : Discussion

6.3 Forces du projet de recherche

6.3.1 Forces pour l’identification des TS

L’une des principales forces de ce projet de recherche est le jumelage des banques de données administratives du Québec à l’ESCC. D’abord, l’utilisation des données de l’ESCC est un avantage considérable comparativement aux autres études épidémiologiques qui utilisent seulement des banques de données administratives pour obtenir les caractéristiques des participants à l’étude. L’ESCC, une enquête nationale réalisée annuellement par Statistique Canada, permet d’avoir une grande quantité et diversité de variables pour les participants à l’étude (plus de 40 variables par personne). Dans le cadre de notre projet de recherche, les données de l’enquête étaient

disponibles sur une période de sept ans (2007 à 2013). Ensuite, bien que l’ESCC soit réalisée sous forme de questionnaire auto-rapporté, cette enquête demeure tout de même une bonne mesure pour obtenir les caractéristiques des participants, puisqu’il s’agit d’un questionnaire validé administré par des interviewers formés90. Chaque cycle d’enquête est étudié pour en évaluer la qualité. Également, pour s’assurer d’avoir un échantillon fiable de la population canadienne, 130 000 participants sont questionnés à chaque cycle. Statistique Canada s’assure également que la stratégie de répartition de l’échantillon est équitable entre les provinces pour ainsi être en mesure de réduire les résultats de l’ESCC au niveau provincial90. Ainsi, dans notre projet de recherche, il a été possible de sélectionner uniquement les résidents du Québec et de conserver un échantillon représentatif des résidents du Québec. Enfin, pour chaque cycle d’enquête les participants devaient accepter le jumelage de leurs données aux banques administratives. Pour l’ensemble des cycles, le taux d’acceptation s’élève à au moins 90%, ce qui augmente considérablement la possibilité d’avoir un échantillon représentatif de la population du Québec105,106. Ainsi, le jumelage des banques de données administratives à l’ESCC nous a permis d’avoir une quantité importante d’information sur les patients, autant au niveau de l’utilisation des services de santé que des caractéristiques individuelles et d’obtenir une échantillon représentative de la population québécoise grâce à la méthode d’échantillonnage utilisée et au taux de réponse très élevé.

Ensuite, les banques de données administratives (RAMQ, MED-ÉCHO et RED/D) reflètent l’utilisation réelle des services de santé au Québec. En effet, ces données sont récoltées indépendamment des études réalisées et l’absence d’intervention de la part de notre équipe de recherche permet d’obtenir des données représentatives de la situation au Québec. De plus, les données de la RAMQ et de MED-ÉCHO étaient disponibles pour une période de 20 ans (1996 à 2016), permettant d’avoir une vue d’ensemble sur la quantité, la fréquence et la durée des hospitalisations, visites à l’urgence et visites ambulatoires, en plus de bien capturer l’évolution des individus quant à leur utilisation du système de santé pendant deux ans. Ces banques de données couvrent la très grande majorité de la population québécoise (>96%) et dans notre cas, l’ensemble de notre population à l’étude, ce qui augmente la représentativité de notre étude92.

De plus, contrairement aux données obtenues de questionnaires auto-rapportés, les données administratives sont objectives et plus rapides à obtenir.

Une autre force de notre projet de recherche est la définition opérationnelle utilisée pour définir le diagnostic de MPOC. La définition utilisée, établie par Gershon et al., a une sensibilité de 85,0% et une spécificité de 78,4%95. Cette définition a été validée en utilisant un panel d’experts comme norme d’excellence (gold standard). Ainsi, bien que le diagnostic de MPOC était rapporté par le patient lors de l’ESCC, c’est le diagnostic de MPOC enregistré dans les banques de données administratives qui a été utilisé afin de diminuer l’erreur de mesure. En effet, il a été démontré que la prévalence de la MPOC était grandement sous-estimée lorsqu’auto-rapportée par le patient (4,8%) et qu’au contraire, elle est très similaire aux mesures cliniques (8,1%) lorsqu’obtenue via des données administratives (8,3%)96.

L’utilisation d’une méthode statistique émergente, soit l’analyse de séquences, est également un très grand avantage dans ce projet de recherche. En effet, l’identification des TS à l’aide de cette méthode permet une identification objective des TS basée sur des données empiriques. De plus, comparativement aux autres méthodes statistiques permettant l’identification de TS, l’analyse de séquences prend en considération la séquence, la durée ainsi que le changement d’un évènement à un autre lors de l’identification des TS. Ainsi, cela permet d’obtenir des TS plus complètes, contrairement à l’analyse de classes latentes ou les modèles de Markov qui ne prennent pas tous ces aspects en considération.

6.3.2 Forces pour l’identification des caractéristiques des patients qui

déterminent l’appartenance aux TS

La force principale pour l’obtention des caractéristiques des patients à l’étude vient de l’utilisation de l’ESCC. En effet, les études existantes traitant des TS7,8 n’utilisent que des banques de données administratives pour obtenir les caractéristiques des individus à l’étude, limitant ainsi la quantité et la diversité des variables à l’étude. Or, dans l’ESCC plus de 40 caractéristiques sont disponibles pour les répondants, allant de l’âge des individus à leur consommation de fruits et de légumes.

Dans le cas de notre étude, bien qu’une partie de ces variables n’étaient pas pertinentes pour nos objectifs de recherche, la très vaste majorité des variables des patients proviennent de l’ESCC. Ainsi, en plus d’avoir les caractéristiques des patients provenant des banques de données administratives du Québec, comme les études précédemment publiées, notre étude permet, en plus, d’avoir une plus grande quantité et diversité de caractéristiques pour les patients à l’étude grâce à l’utilisation de l’ESCC. Cela nous donne ainsi plus de chance d’identifier les caractéristiques des patients qui déterminent l’appartenance aux TS.

6.3.3 Forces pour l’association d’intérêt

6.3.3.1 Biais de sélection

Le biais de sélection est une erreur systématique qui peut survenir lors de l’échantillonnage ou du suivi des participants à l’étude. Il provient des facteurs qui influencent la participation des patients dans une étude. Ce biais apparaît lorsque l’association entre l’exposition et l’issue d’intérêt diffère entre les participants et les non-participants.

Dans notre étude, les non-participants sont les individus n’ayant pas répondu à l’ESCC entre 2007 et 2013, ceux ayant rapporté avoir une MPOC uniquement dans l’ESCC et non un diagnostic dans les banques de données administratives, ainsi que les individus décédés dans les deux ans suivant l’ESCC. Or, le biais de sélection est énormément limité dans le cas du premier critère d’inclusion, puisque cette enquête nationale recense 97% de la population canadienne par une méthode d’échantillonnage à deux strates où chaque strate est formée de grappes90. Ainsi, l’ESCC permet d’obtenir un échantillon représentatif de la population canadienne et peut être réduite aux provinces. Le taux de réponse à chaque cycle d’enquête est d’environ 90% et parmi ces individus, plus de 90% acceptent le jumelage de leurs données aux données administratives.

Pour ce qui est des autres critères d’inclusion, ceux-ci seront abordés dans la section des limites du présent mémoire.

6.3.3.2 Biais d’information

Le biais d’information est défini comme une erreur systématique lors de la classification des participants au niveau de l’exposition ou de l’issue d’intérêt. Ce biais se partage entre deux catégories : biais d’information différentiel et biais d’information non-différentiel.

Le biais d’information différentiel survient lorsqu’une erreur systématique de mesure se produit. Dans une étude de cohorte, ce biais survient lorsque l’erreur de mesure de l’issue d’intérêt dépend de l’exposition des participants.

Dans ce projet de recherche, comme l’exposition et l’issue proviennent de banques de données administratives, où l’information est enregistrée de façon prospective, indépendamment de notre étude, il est raisonnable de soupçonner qu’aucun biais d’information différentiel n’est présent. En effet, ces données sont récoltées indépendamment des études réalisées et l’absence d’intervention de la part de notre équipe de recherche permet de limiter le biais d’information tout en obtenant des données représentatives de la situation au Québec.

Pour ce qui est du biais d’information non-différentiel, celui-ci sera abordé dans la section des limites du présent mémoire.

6.3.3.3 Biais de confusion

Le biais de confusion est caractérisé comme une erreur systématique dans l’association d’intérêt causée par la présence d’une variable confondante associée à l’exposition et à l’issue d’intérêt. Les études observationnelles sont particulièrement à risque de biais de confusion à cause de l’absence de randomisation.

Pour limiter le biais de confusion dans ce projet de recherche, 13 facteurs de risque ont été pris en compte dans les modèles de Cox pour évaluer l’association entre les TS et la mortalité. Ainsi, l’inclusion de nombreux facteurs de risque, lors de l’ajustement du modèle, permet de grandement limiter le biais de confusion dans l’association d’intérêt.

Pour ce qui est des variables potentiellement confondantes non mesurées, celles-ci seront discutées dans la section des limites du mémoire.