• Aucun résultat trouvé

Chapitre 3 : Méthodologie

3.3 Instruments de mesure

Puisque les concepts sur lesquels repose la recherche ne peuvent être mesurés directement, il est nécessaire de les exprimer sous une forme opérationnelle afin de les

rendre aptes à décrire les comportements (Fortin et al., 2006). Pour cela, il faut avoir recours à un instrument de mesure valide servant à collecter les données pour répondre adéquatement aux questions de recherche. Dans le cas de la présente étude, un instrument de mesure a été élaboré par l’étudiante-chercheuse (Annexe C) afin d’aller chercher des informations portant sur les causes biopsychologiques dans les dossiers des participants. L’étudiante s’est inspirée des lignes directrices québécoises lors de l’élaboration de l’instrument. Les recommandations issues de ces lignes ont donc grandement influencé le développement de l’instrument de mesure de cette étude. Elle s’est aussi inspirée des données probantes en lien avec le sujet à l’étude afin d’être le plus exhaustif possible dans la préparation et la mise en œuvre de l’instrument.

L’étudiante a également consulté la structure de formulaire vide de l’équipe de mentorat (Annexe D). En ce sens, l’instrument développé par l’étudiante reprend les grandes sections de l’outil clinique utilisé par les infirmières de l’équipe de mentorat du CEVQ. Dans cet outil, les données biopsychologiques qui ont été mesurées sont catégorisées dans les sections suivantes : les signes vitaux, l’évaluation des problèmes de santé, l’examen de l’état mental, l’examen cardiaque, l’examen pulmonaire, l’examen abdominal et l’examen musculosquelettique et risque de chute. Il faut aussi noter qu’au sein des formulaires de l’équipe de mentorat, il existe des outils déjà validés qui sont utilisés par les infirmières. Les prochains paragraphes présenteront les qualités psychométriques de ces outils.

Pour déterminer l’efficacité des interventions, les infirmières ont recours au Cohen- Mansfield Agitation Inventory (CMAI) et au Neuropsychiatric Inventory (NPI) Cummings. Dans le cadre de cette étude, des données ont été accessibles sur les scores du CMAI et du NPI avant et après la mise en place des interventions. Le fait d’avoir accès à de telles données a pour avantage de déterminer l’efficacité des interventions proposées et de bonifier les connaissances sur ces interventions.

Le CMAI est un outil qui a été développé pour évaluer les comportements d’agitation (Kupeli et al., 2018). C’est une mesure qui contient 29 éléments notés sur une échelle de Likert à sept points (« Jamais » à « Plusieurs fois par heure ») (Cohen-Mansfield, 1991, 1997; Cohen-Mansfield, Marx et Rosenthal, 1989; Kupeli et al., 2018). Il est réparti en quatre catégories distinctes que sont les comportements physiques non agressifs (neuf éléments), les comportements physiques agressifs (douze éléments), les comportements verbaux non

agressifs (quatre éléments) et les comportements verbaux agressifs (quatre éléments) (Cohen-Mansfield, 1991, 1997; Kupeli et al., 2018). Un score total compris entre 29 et 203 peut indiquer un état d’agitation globale (Kupeli et al., 2018). Cet outil a été validé dans différents milieux (Cohen-Mansfield, 1991). Il a été démontré que le CMAI a une cohérence interne élevée (0,86 à 0,91) (Finkel, Lyons et Anderson, 1992). Il a une bonne fiabilité au test-retest (r = 0,74 à 0,92) (Koss et al., 1997) et une fiabilité inter-juges dans le temps (Chrisman, Tabar, Whall et Booth, 1991; Kupeli et al., 2018). Des corrélations élevées ont également été trouvées entre le CMAI et d’autres mesures de SCPD (Finkel et al., 1992).

Le NPI est un outil de mesure conçu pour évaluer les SCPD fréquemment observés chez les patients atteints de TNCM (Wood et al., 2000). Cet instrument évalue 12 sortes de SCPD que sont les hallucinations, les idées délirantes, la dysphorie, l’anxiété, l’agitation, l’euphorie, l’apathie, l’irritabilité, la désinhibition, le comportement moteur anormal, les troubles de comportement nocturnes et les changements alimentaires (Cummings, 1997; Wood et al., 2000). Le score pour chaque SCPD est obtenu en multipliant sa sévérité (1 à 3 points) avec sa fréquence (1 à 4 points) (Aalten et al., 2003). La somme des scores de l’ensemble des SCPD donne le score total du NPI (Aalten et al., 2003). Sa validité, sa fiabilité inter-juges et sa fiabilité au test-retest ont été démontrées (Aalten et al., 2003; Cummings, 1997; Wood et al., 2000). Les coefficients de corrélation au test-retest variaient de 0,64 à 0,86 dans différentes études (Camozzato et al., 2008). Choi et al. (2000) ont évalué la fiabilité au test-retest du NPI à l’aide du coefficient de corrélation Spearman. Les fiabilités au test-retest de la fréquence et de la gravité de tous les SCPD étaient significativement élevées (tous p < 0,001). Le coefficient de fiabilité du NPI dans cette étude était élevé (0,85). Un résultat similaire a été obtenu dans l’étude de Camozzato et al. (2008), où le coefficient de fiabilité pour l’ensemble des SCPD se situait à 0,70.

La douleur est évaluée à l’aide du Pain Assessment Checklist for Seniors with Limited Ability to Communicate (PACSLAC) et du Pain Assessment in Advanced Dementia (PAINAD). Le PACSLAC est un outil d’observation qui a été conçu à l’origine pour évaluer la douleur, et ce, spécifiquement chez des personnes âgées atteintes de TNCM ayant une capacité limitée à communiquer (Chan, Hadjistavropoulos, Williams et Lints-Martindale, 2014; Fuchs-Lacelle et Hadjistavropoulos, 2004). Il comprend un total de 60 éléments répartis en quatre catégories que sont les expressions faciales (13 éléments), l’activité/les mouvements du corps (20 éléments), le social/la personnalité/l’humeur (12 éléments) et les

indicateurs physiologiques/changements dans l’alimentation et le sommeil/les comportements vocaux (15 éléments) (Chan et al., 2014; Cheung et Choi, 2008; Herr, Bursch, Ersek, Miller et Swafford, 2010). Chaque élément est évalué selon sa présence ou son absence et plus un élément est présent, plus cela est indicatif d’une plus grande douleur (Cheung et Choi, 2008; Herr et al., 2010). Il a été démontré à travers les études que le PACSLAC a une bonne cohérence interne et une excellente fiabilité inter-juges (Herr et al., 2010). Sa cohérence interne était élevée (α = 0,92) dans l’étude originale (Fuchs-Lacelle et Hadjistavropoulos, 2004). Cette propriété psychométrique du PACSLAC est similaire à celle ressortie dans l’étude de Zwakhalen, Hamers, Abu-Saad et Berger (2006). Dans cette étude, il est indiqué que le PACSLAC a des niveaux élevés de cohérence interne (α = 0,82- 0,92). Dans une autre étude (Cheung et Choi, 2008), le PACSLAC avait une bonne fiabilité inter-juges. Le pourcentage moyen d’accord était de 0,89 et le coefficient de corrélation de Pearson était de 0,83 (p < 0,01) pour l’ensemble des scores au PASCLAC.

Le PAINAD est une mesure valide utilisée pour évaluer la douleur chez les personnes atteintes de TNCM (Warden, Hurley et Volicer, 2003; Zwakhalen, van der Steen et Najim, 2012). Cet outil d’observation comprend cinq domaines (respiration, vocalisations négatives, expression faciale, langage corporel et consolabilité), et chacun des domaines est noté sur une échelle de gravité de 0 à 2 points, en mouvement et au repos (maximum de 10 points) (Sampson et al., 2015; Warden et al., 2003; Zwakhalen et al., 2012). Un score ≥ 2 indique la présence de douleur (Sampson et al., 2015; Zwakhalen et al., 2012). Cet outil a démontré des niveaux élevés de fiabilité inter-juges (0,82 à 0,97) (Warden et al., 2003; Zwakhalen, Hamers, Abu-Saad et al., 2006; Zwakhalen, Hamers et Berger, 2006). Les résultats de l’étude de Zwakhalen, Hamers et Berger (2006) ont démontré des niveaux adéquats de cohérence interne pour le PAINAD (α = 0,69-0,74).

En ce qui a trait à la dépression, elle est déterminée à l’aide de l’échelle de dépression gériatrique (EDG) et le Cornell. L’EDG est une mesure composée de 30 items et destinée

au dépistage de la dépression chez une population de personnes âgées (Kørner et al., 2006; Parmelee, Lawton et Katz, 1989). Les réponses sont scorées par l’attribution d’un (1) point si le symptôme est présent et de zéro (0) s’il est absent. Par la suite, les scores sont additionnés pour donner un score total. Un score supérieur à 10 sur un total de 30 indique une présence de dépression (Kørner et al., 2006; McCurren, 2002). Cette échelle a une cohérence interne très élevée (0,94) (Yesavage et al., 1982). La fiabilité au test-retest

était de 0,85 (p < 0,001) (Yesavage et al., 1982). Les études qui ont utilisé l’EDG ont trouvé des cohérences internes se situant entre 0,82 et 0,99, des fiabilités au test-retest entre 0,85 et 0,94, des rapports de spécificité de 0,74 à 0,86, et un rapport de sensibilité de 0,69 (McCurren, 2002). Dans l’étude de Parmelee et al. (1989), l’EDG avait une bonne consistance interne (α = 0,91); la fiabilité au test-retest était également élevée (r = 0,85, p < 0,001). Il existe une version courte de l’EDG qui comprend 15 éléments. Il s’agit de la version utilisée par l’équipe de mentorat du CEVQ. Sa cohérence interne a été évaluée par plusieurs études et la plupart des valeurs de fiabilité rapportées sont d’environ 0,80 (Almeida et Almeida, 1999).

L’échelle Cornell est un outil qui a été spécialement conçu pour dépister les signes et symptômes de la dépression chez les personnes âgées atteintes de TNCM (Alexopoulos, Abrams, Young et Shamoian, 1988). Le Cornell comprend 19 éléments, et la gravité de chaque élément est graduée sur une échelle de zéro (0) à deux (2) (0 = absent, 1 = léger ou intermittent, 2 = sévère) (Alexopoulos et al., 1988; Kørner et al., 2006). Les scores de chaque élément sont ensuite additionnés. Le score minimum est zéro et le maximum est 38 (Barca, Engedal et Selbæk, 2010). Les scores supérieurs à 10 indiquent une dépression majeure probable, les scores supérieurs à 18 indiquent une dépression majeure définie (Alexopoulos et al., 1988). En règle générale, les scores inférieurs à 6 sont associés à l’absence de symptômes dépressifs significatifs (Alexopoulos et al., 1988). Dans l’étude de Kørner et al. (2006), le Cornell a démontré une bonne fiabilité inter-juges (0,84). Toujours dans la même étude, il a atteint une sensibilité (0,93) et une spécificité (0,97) impressionnantes pour tous les patients (avec ou sans TNCM). Ses résultats étaient encore plus importants pour les patients atteints de TNCM, spécifiquement en ce qui concerne la sensibilité (0,97) et la spécificité (1) (Kørner et al., 2006). Vida, Des Rosiers, Carrier et Gauthier (1994) ont, quant à eux, trouvé une sensibilité de 0,90 et une spécificité de 0,75.

Quant au delirium, il est mesuré à l’aide du Confusion Assessment Method (CAM) et du 4 ‘A’s Test (4AT). Le CAM est un outil qui facilite la détection du delirium et il a été souvent utilisé dans la littérature. En fait, selon Inouye, Westendorp et Saczynski (2014), il s’agit de l’instrument le plus largement utilisé afin de détecter le delirium et il a été validé dans de nombreuses études de haute qualité. Il a démontré une grande sensibilité (plus de 94 %), une grande spécificité (plus de 90 %) et une grande fiabilité inter-juges (0,70 à 1) (De et Wand, 2015; Inouye et al., 1990, 2014; Sampson et al., 2014; Wei, Fearing,

Sternberg et Inouye, 2008). Afin de déceler le delirium à l’aide du CAM, quatre critères sont à considérer : 1) apparition soudaine et fluctuation des symptômes; 2) inattention; 3) désorganisation de la pensée; et 4) altération de l’état de conscience (Ely et al., 2001; Inouye et al., 2014). Un résultat est considéré positif, c’est-à-dire qu’il indique la présence de delirium, si les deux premiers critères sont présents ainsi que l’un ou l’autre des critères trois et quatre (Ely et al., 2001).

Le 4AT est quant à lui un nouvel outil de dépistage du delirium. Il est divisé en quatre catégories (Bellelli et al., 2014; De et Wand, 2015). La première catégorie évalue le niveau de vigilance. Les deux catégories suivantes sont de brefs tests de dépistage cognitif (AMT4 et le test de l’attention). La dernière catégorie évalue le changement aigu ou la fluctuation de l’état mental. Le score du 4AT est noté de 0 à 12 (Bellelli et al., 2014). Un score de 0 signifie que le delirium est peu probable, les scores entre 1 et 3 suggèrent une atteinte cognitive modérée à sévère et un score de 4 ou plus suggère un possible delirium (Bellelli et al., 2014). Le 4AT est une méthode valide de dépistage du delirium avec une sensibilité et une spécificité élevées (89,7 % et 84,1 % respectivement) (Bellelli et al., 2014; De et Wand, 2015).

Avant le début de la collecte de données, l’instrument développé par l’étudiante dans le cadre du présent mémoire a fait l’objet d’un prétest pour s’assurer de sa clarté. L’instrument a été complété à l’aide de trois dossiers choisis aléatoirement par l’étudiante. Les trois dossiers ont été évalués par l’étudiante et une collègue de travail. Par la suite, les données collectées ont été comparées afin de s’assurer qu’elles sont similaires. Lorsque des divergences étaient présentes, l’outil était modifié en conséquence pour augmenter sa clarté. Le but était donc de vérifier la clarté du contenu de l’instrument de collecte de données afin d’assurer sa facilité d’utilisation, sa capacité à collecter les données, mais aussi son harmonie inter-juges. De plus, il s’agissait de s’assurer que les informations qui ont été obtenues illustrent bien ce que l’étudiante souhaitait mesurer et non un autre concept. Le cas échéant, des ajustements étaient effectués par l’étudiante et son directeur de recherche.

Par ailleurs, des grilles ont également été élaborées par l’étudiante afin de recueillir des données sociodémographiques sur les participants telles que l’âge, le sexe, le lieu de résidence, le type de TNCM et de SCPD, la médication prescrite et l’état civil (Annexe A). Ces données sociodémographiques ont été collectées dans le but de décrire les participants qui ont été inclus dans l’étude. Les scores du mini-examen de l’état mental (MEEM) obtenus par les infirmières du CEVQ ont aussi été utilisés. Des données ont également été ressorties sur

les antécédents des participants en s’inspirant de l’index de comorbidité de Charlson (ICC)

(Annexe B), et ce, toujours dans la même optique de bien décrire l’échantillon à l’étude. Il est important de préciser que le MEEM et l’ICC sont aussi des instruments qui ont été validés.

Le MEEM a été conçu comme méthode clinique permettant d’évaluer les troubles cognitifs (Folstein, Robins et Helzer, 1983). Il produit un score qui permet de détecter la présence de troubles cognitifs (Folstein et al., 1983). Un score inférieur à 24 sur un total maximum de 30 indique une présence de troubles cognitifs (Folstein, Folstein et McHugh, 1975; Tombaugh et McIntyre, 1992). Ses scores suivant les changements de l’état cognitif des patients (Folstein et al., 1975), le test peut donc être utilisé pour suivre l’évolution du profil de ces derniers relativement à leur fonction cognitive (Folstein et al., 1983). Ses scores peuvent aussi être utilisés pour classer le stade des TNCM comme étant légers, modérés ou sévères (Tombaugh et McIntyre, 1992). Plusieurs études ont testé la validé du MEEM (Tombaugh et McIntyre, 1992). Selon les mêmes auteurs, les résultats des études démontrent que les coefficients de fiabilité de cet instrument se situent entre 0,80 et 0,95. De plus, la sensibilité et la spécificité du MEEM, soit 87 % et 82,4 % respectivement, le rendent utile dans le dépistage des troubles cognitifs dans une large population médicale (Anthony, LeResche, Niaz, Von Korff et Folstein, 1982; vonAmmon Cavanaugh, 1983).

L’ICC est un outil valide qui a été élaboré dans l’optique de classifier les comorbidités afin de mesurer le risque de mortalité qui leur est associé sur une période d’un an ou plus (Charlson, Pompei, Ales et MacKenzie, 1987; Roffman, Buchanan et Allison, 2016). Cet outil comprend 17 comorbidités, avec deux sous-catégories pour le diabète et les maladies hépatiques (Roffman et al., 2016). Chaque comorbidité est pondérée de 1 à 6, les scores étant ensuite additionnés pour donner le score total (Roffman et al., 2016). Les scores égaux ou supérieurs à 5 ont été associés à un taux de mortalité de 85 % après un an, tandis que le taux de survie à 10 ans pour un ICC de 5 était de 34 % (Roffman et al., 2016). L’ICC a une fiabilité inter-juges modérée à bonne (0,74 à 0,945) chez les patients plus âgés atteints de cancer. Il a une fiabilité au test-retest élevée avec des coefficients de corrélation intraclasse de 0,92 (p < 0,0001) (Roffman et al., 2016). Charlson, Szatrowski, Peterson et Gold (1994) ont aussi tenté de confirmer la validité de l’ICC. Dans leur étude, les chercheurs ont constaté que le risque de mortalité associé à une combinaison de l’âge et la présence de comorbidité augmentait à 1,45 (intervalle de confiance : 1,25-1,68) au lieu de 1,4 lorsqu’on prend les deux variables séparément. Ainsi, le score combiné âge-comorbidité de

l’ICC était un prédicteur hautement significatif du risque de mortalité avec un coefficient de régression de 0,37 (p < 0,0001).

Documents relatifs