INTERPRÉTATION DES RÉSULTATS - Altération des muscles stabilisateurs de la scapula et cervicalg

4.1.1. Types d’études

Dans sa pyramide des niveaux de preuve, le Centre Cochrane Français (2011a) désigne les revues systématiques et les méta-analyses comme les études ayant le meilleur niveau de preuve scientifique, étant donné que ce sont des synthèses de la littérature. Il est ensuite énoncé que le type d’étude idéal pour répondre à une question étiologique, comme c’est le cas dans les 5 études incluses dans ce travail, serait, dans l’ordre, l’essai contrôlé randomisé, l’étude cohorte puis l’étude cas-témoins.

Uniquement des études de type cas-témoins ont été utilisées pour répondre à la question de recherche. En effet, de par la thématique relativement récente, il n’existe actuellement pas d’étude cohorte à ce sujet. Les études cas-témoins permettent par ailleurs d’avoir des résultats rapidement et à moindre coût, tout en nécessitant un nombre inférieur de sujets en comparaison avec une étude longitudinale.

Le niveau de preuve de ces 5 études correspond donc au niveau 3 d’après la Haute Autorité de Santé (HAS) (2013). Les études cas-témoins sont en lien direct avec un faible niveau de preuve scientifique (grade C pour les recommandations).

4.1.2. Qualité méthodologique

Comme déjà dit précédemment, la qualité de toutes les études a été évaluée au moyen de la grille JBI-MAStARI pour étude cohorte/cas-témoins. Parmi les cinq études incluses dans ce travail, quatre ont obtenu 7 points et une a obtenu 6,5 points, sur un total de 8 points après ajustement du score total. Cela démontre donc une bonne qualité. En analysant en détail les différents items, il est possible de remarquer que toutes les études sont bien menées. En revanche, quatre études sur cinq perdent un point au premier item, en lien avec l’échantillon de la population. En effet, ce dernier n’est pas représentatif de la population. Cet aspect diminue de ce fait la qualité des études étant donné qu’il limite la portée des résultats. Une description plus détaillée sera présentée dans la section suivante.

Il est donc possible de dire que ces études représentent les meilleures informations disponibles actuellement, avec une bonne qualité par rapport au type d’étude.

4.1.3. Population

Pour commencer, les échantillons d’individus retenus dans les études sélectionnées dans ce travail sont relativement petits. Il est à noter que 4 études sur 5 portent sur une population de moins de 45 individus et que le travail qui comporte le plus grand échantillon d’individus (n=72) porte sur un troisième groupe « Whiplash Associated Disorder », groupe dont les données ne sont pas exploitables pour répondre à la problématique de cette revue. Cette faible proportion remet en cause la validité interne des résultats obtenus. Ainsi, les conclusions de cette revue de la littérature sont à pondérer.

De plus, il se peut que deux études, bien qu’utilisant des méthodes expérimentales différentes, portent sur un même échantillon d’individus. En effet, les études menées par Wegner et al. (2010) et Zakharova-Luneva et al. (2012) portent toutes deux sur un échantillon de 38 individus avec des caractéristiques très similaires. La principale différence entre les populations est la proportion hommes/femmes au sein du groupe symptomatique qui varie d’un seul individu entre les études (12F/6H versus 11F/7H). Cet élément est contradictoire avec l’hypothèse avançant que les deux études portent sur le même échantillon, à moins que les tests n’aient porté sur un échantillon plus large que celui présenté et que les deux équipes de chercheurs aient sélectionné des individus différents pour leurs études respectives à partir des données résultantes. Enfin, un argument de poids pour supposer un rapprochement entre les populations de ces travaux de recherche : Gwendolen Jull, Venerina Johnston et Shaun O’Leary sont tous les trois des chercheurs affiliés à l’Université de Queensland en Australie, et ont tous participé à l’élaboration des deux études sus-mentionnées.

Le fait que 2 études sur 5 aient potentiellement porté sur une population très proche est un risque pour la tranférabilité des conclusions de cette revue, car des biais et une mauvaise systématique lors du recrutement et de la répartition des participants auraient des répercussions deux fois plus importantes. Il n’y a pour autant pas d’élément qui laisse supposer d’erreurs flagrantes de ce type dans ces études. De plus, il faudrait disposer de données supplémentaires pour affirmer objectivement que ces échantillons sont les mêmes. L’étude menée par Sheard et al. (2012) est aussi très proche de l’étude de Zakharova-Luneva et al. (2012) de par leur design expérimental. Les conclusions à en tirer sont les mêmes que celles émises à propos de la ressemblance entre les travaux de Zakharova-Luneva et al. et Wegner et al.

La majorité des études a utilisé le Neck Disability Index (NDI) (Annexe V), questionnaire d’auto-évaluation du handicap, pour l’inclusion des participants dans les groupes symptomatiques. Les auteurs ont choisi des seuils relativement proches et conformes aux données existantes issues de la littérature. Les cotations du NDI des populations pathologiques sélectionnées sont pour certaines études homogènes (Zakharova-Luneva et al. ou Wegner et al.) alors que moins pour d’autres (Helgadottir et al). Parmi les études présentant l’échelle NDI pour évaluer le handicap (4 études sur 5, dont 3 présentent moyenne et DS), la grande majorité des sujets cervicalgiques ont des cotations

comprises entre 14.7 et 39/100. Selon l’interprétation des cotations présentée par Vernon (2008), ils présentent donc des cervicalgies qualifiées de modérées à complètes. Les études concernées vont dresser des conclusions qui ne seront a priori pas destinées aux cervicalgies légères. Cette population reste à explorer et il serait intéressant de savoir si ces conclusions sont transférables à ces patients ou s’il existe un effet seuil limitant la transférabilité des résultats à cette population.

L’étude menée par Helgadottir et al. (2011) est la seule à avoir évalué le niveau d’activité des individus de chaque groupe pour recruter des individus témoins fidèles. Prendre en compte ce point améliore la validité interne de cette étude car il permet d’éliminer des facteurs de confusion tels que la kinésiophobie ou l’activité physique par exemple. Bien que les études sélectionnées ne portent pas sur des interventions à long terme, les tâches expérimentales peuvent tout de même être faussées par certains facteurs psycho-sociaux. Ainsi, l’ensemble des études concernées auraient idéalement pu introduire des questionnaires traitants d’aspects plus “psycho-sociaux” dans leurs méthodologies de sélection d’individus afin, d’y confronter un groupe contrôle le plus fidèle possible. Le Tampa Kinesiophobia Scale en serait un bon exemple (Annexe VI). De plus, afin de garantir une correspondance des niveaux d’activité des deux groupes, les chercheurs auraient pu introduire un questionnaire évaluant les habitudes de vie des individus, tel que l’IPAQ (Annexe VII).

La proportion d’hommes versus la proportion de femmes est déséquilibrée dans la plupart des études retenues, bien que les proportions intergroupes soient égales. Selon une étude d’Ostergren et al. (2005), dans une population d’adultes actifs âgés de 45 à 64 ans, 6% des hommes versus 8% des femmes souffrent de cervicalgies. Donc d’après ces auteurs, il y a certes une majorité de femmes concernées par cette pathologie (57%), mais les échantillons de participants de cette revue ne sont pas représentatifs de la population générale. Ainsi, il est à nouveau important de lire les conclusions de cette revue avec précaution car cette disproportion apparente altère la validité externe des études sélectionnées.

Parmi les études sélectionnées, celles de Sheard et al. (2012), Zakharova-Luneva et al. (2012) et Wegner et al. (2010) ont exigé la présence d’une dysfonction scapulaire pour faire partie du groupe « cervicalgique ». Est-ce un plus ou serait-ce superflu d’ajouter cette spécificité à la population symptomatique? Ajouter une caractéristique autre que la présence de cervicalgies en stade chronique pour décrire la population symptomatique ne semble pas cohérent sur le plan méthodologique. Ceci rajoute une variable indépendante à considérer et rend les résultats plus difficiles à interpréter. En effet, comment savoir si une altération de l’activité musculaire du dentelé antérieur est due à l’altération de la dynamique scapulaire ou à la cervicalgie? Du fait qu’aucune étude n’ait à ce jour mis en évidence une plus grande prévalence de dyskinésie scapulaire chez des patients souffrant de cervicalgies (Castelein et al., 2015), ces deux variables ne sont pas liées. Le design de ces études n’est donc pas méthodologiquement optimal au vu des objectifs respectifs des auteurs mais elles ont pour

autant un intérêt pour comprendre et justifier l’incidence de certaines prises en charge sur la région cervicale.

La manière de mettre en évidence la dysfonction scapulaire, requise par les trois équipes de chercheurs mentionnés ci-dessus, est relativement variée d’une étude à l’autre et les méthodes d’évaluation ne sont pas conformes aux dernières recommandations en vigueur. En effet le Scapular Summit 2009 (Kibler et al., 2009) et le Scapular Summit 2013 (Kibler et al., 2013) recommandent l’utilisation du Scapular Dyskinesis Test (SDT), comme mentionné dans l’introduction de ce travail. Pour rappel, ce dernier consiste à évaluer visuellement la présence ou non de dysrythmie ou de décollement de la scapula, éléments caractéristiques de la dyskinésie scapulaire, lors de l’élévation des membres supérieurs avec différents poids (McClure e

En regard avec ces recommandations, les trois études mentionnées cherchent toutes à désigner par oui ou non la présence de dysfonction scapulaire sans pour autant appliquer rigoureusement le SDT. En effet, il s’agit du principal manque dans les procédures de Zakharova-Luneva et al. (2012) et Wegner et al. (2010), bien que la manière dont ils décrivent la position idéale de la scapula au repos soit très complète. Ces imprécisions ont au final une importance moindre quant aux conclusions de cette revue, du fait que son objectif est d’identifier une éventuelle différence d’activité des muscles sélectionnés indifféremment des manifestations cliniques de dyskinésie scapulaire. La transférabilité des résultats de cette revue n’est cependant pas garantie en raison d’un échantillon de population trop spécifique.

Pour finir, l’étude menée par Szeto et al. a permis de mettre en évidence une augmentation de l’activité de tous les muscles testés du côté dominant, quel que soit le groupe auquel les individus étaient rattachés. Cette information laisse supposer que la latéralité joue un rôle prédominant dans l’activité musculaire et pourrait être à l’origine d’une grande variabilité des valeurs au sein d’un même groupe. La main dominante est donc à considérer lors de l’échantillonnage afin d’éviter qu’une différence d’activité musculaire ne soit attribuée à la cervicalgie, alors qu’elle serait en réalité liée à la latéralité des sujets. Cela est repris dans l’étude de Shih et Kao (2011) dont la conclusion énonce que la latéralité a son importance chez des patients cervicalgiques, étant donné qu’elle influe sur la cinématique scapulaire.

4.1.4. Tâche expérimentale

Malgré le fait que deux études (Szeto et al., 2005; Wegner et al. 2010) sont menées sur une tâche de dactylographie sur ordinateur, une variation apparaît quant à la durée d’évaluation. Aucune justification n’est présentée quant à la durée de la tâche définie par les auteurs, mais cela pourrait être expliqué par le fait que l’étude de Szeto et al. porte sur des individus pour qui cette tâche représente leur métier. Il est de ce fait intéressant et justifié de prendre en compte le critère d’endurance qui pourrait mener à une fatigabilité musculaire. Or, Wegner et al. ont plutôt choisi cette tâche pour

représenter une activité fonctionnelle commune à tous. L’écart retrouvé entre ces deux études exprime de ce fait un biais pour l’interprétation des résultats.

L’étude d’Helgadottir et al. (2011) s’intéresse à une tâche dynamique analytique et non pas fonctionnelle comme les deux études pré-citées. Cette étude s’est intéressée aux deux côtés, or il n’y a pas d’informations au sujet de la latéralité des sujets ou des douleurs. De ce fait, les résultats ne permettent pas une mise en lien précise avec la latéralité. Cela laisse imaginer que soit les auteurs ont décidé que cet élément n’influait pas sur la validité interne de l’étude ou alors qu’ils ont volontairement choisi de ne pas transmettre les résultats en détails. Un autre point faible de cette étude est qu’aucune précision n’est apportée au sujet de l’amplitude de l’élévation/abaissement de l’épaule.

Finalement, les études de Zakharova-Luneva (2012) et Sheard et al. (2012) ont été menées uniquement du côté symptomatique ou le plus symptomatique lorsque les plaintes étaient bilatérales. Une procédure de standardisation a précédé la session expérimentale de ces deux études. Malgré des similitudes au sujet du déroulement des tâches, il est spécifié dans les deux cas que l’évaluateur intervient. Il s’agit d’instructions verbales et d’encouragements pour maintenir une intensité d’effort suffisante en plus du feedback visuel placé devant le patient. Ce point doit être pris comme une potentielle source de biais.

Les tâches expérimentales de ces études sont relativement différentes, mais il est important de rappeler que ce travail est davantage axé sur l’activité musculaire que sur une tâche bien précise. Ainsi, ces études ne sont pas toutes comparables, bien qu’il soit possible d’en tirer des conclusions globales.

4.1.5. Outils de mesure

Quatre études ont privilégié l’utilisation de l’EMG contre une pour l’IRM fonctionnelle. Ce facteur complexifie l’analyse des données car les unités de mesure, étant différentes, les résultats de ces études ne sont pas tous superposables.

Comme abordé dans le cadre théorique, ces deux instruments font preuve d’une bonne validité et fiabilité pour mesurer l’activité musculaire, mais lequel est le mieux adapté à quel muscle? L’EMG est considéré comme le meilleur outil pour mesurer l’activité musculaire superficielle (Basmajian & De Luca, 1985, cité dans Hackett et al., 2014). Cependant sa validité pour mesurer l’activité de muscles plus profonds, tel que le dentelé antérieur, est discutable. En effet, d’après Hackett et al., l’EMG de surface et intramusculaire ne sont pas valides pour mesurer l’activité musculaire du dentelé antérieur lors de certains exercices statiques et dynamiques. Cette étude remet en cause la validité des résultats concernant ce muscle avancés par l’étude de Sheard et. al (2012).

Szeto et al. (2005) présentent une description très détaillée de la procédure de normalisation d’obtention des mesures électromyographiques et font donc office de référence pour la discussion des

résultats obtenus. Pour une mesure d’activité des muscles visés bien normalisée, cette équipe de chercheurs s’est basée sur une l’étude de Aaras, Veierod, Larsen Ortengren & Ro (1996), étude de bonne qualité dont la procédure a démontré une bonne fiabilité. La littérature sur laquelle se basent les auteurs pour établir leur procédure de normalisation et le niveau de précision respecté quant à la manière dont ils obtiennent et traitent les mesures d’activité musculaire contribuent à assurer une bonne validité interne de l’étude.

En comparaison avec l’étude précédente, l’étude d’Helgadottir et al. (2011) présente certaines différences de taille à propos de la présentation de la normalisation de leurs mesures. Il faut noter que la manière dont les mesures EMG sont exprimées est absente. De plus, ils n’ont pas utilisé la notion de force de contraction volontaire maximale, afin d’exprimer les valeurs d’activité EMG en termes de proportion de l’activité maximale. Enfin, l’efficacité de l’EMG de surface pour mesurer l’activité musculaire du dentelé antérieur n’est pas questionnée par les auteurs et ce point très important est pourtant discuté et remis en question plus haut. Ce dernier point remet en doute la fiabilité de la mesure pour ce muscle. Enfin, en ce qui concerne le trapèze inférieur, la reproductibilité de la procédure de mesure est bonne et l’absence de la mention de la manière dont les valeurs sont exprimées est le principal bémol de cette section.

La procédure de normalisation suivie par Zakharova-Luneva et al. (2012) est abordée de manière beaucoup plus superficielle que les deux études précédentes. Les auteurs ne mentionnent à nouveau pas l’unité de mesure employée et ne présentent pas non plus les résultats chiffrés de l’activité musculaire. Les auteurs précisent bien, malgré tout, la manière dont les données ont été utilisées afin de permettre leur analyse. Le faible degré de précision des informations altère la reproductibilité de leur travail et n’assure pas une fiabilité optimale de la mesure de l’activité musculaire du trapèze inférieur à l’aide de l’EMG.

Enfin, l’étude de Wegner et al. (2010) présente l’avantage de mesurer l’activité de base pré-tâche expérimentale, ce qui permet de contrôler des biais éventuels pouvant altérer la mesure. Beaucoup de paramètres sont très semblables à ceux sélectionnés par l’équipe de Zakharova-Luneva et al. (2012). Cette grande ressemblance est discutée dans la section « Limites et points forts » de ce travail. Le niveau de précision ici est suffisant pour garantir une bonne fiabilité des mesures EMG.

L’activité musculaire mesurée par l’IRM fonctionnelle dans l’étude de Sheard et al. (2012) a été évaluée à l’aide de paramètres de normalisation différents, du fait de la nature du processus de mesure. Les niveaux de coupes d’imagerie se situent entre les niveaux T6 et T10 afin de mesurer, comme le mentionnent les auteurs, l’activité des portions inférieures du dentelé antérieur. Ce choix est éventuellement dû à la superposition des portions supérieures et moyennes du dentelé antérieur avec le muscle sub-scapulaire. En effet, les auteurs mentionnent dans leur conclusion qu’ils ne peuvent exclure l’inclusion de certaines fibres du muscle sub-scapulaire, malgré une grande attention portée à

la localisation des régions musculaires d’intérêt. L’influence des structures environnantes sur la mesure de l’IRM fonctionnelle est relativement faible en comparaison avec les mesures EMG superficielles et intramusculaires. En effet, selon Cagnie et al. (2011), les mesures à l’aide de cette technologie éliminent les interférences et autres altérations de signal liées à l’impédance tissulaire propre à l’utilisation de l’EMG. Au vu du bon niveau de précisions apporté par les auteurs et la pertinence d’utiliser l’IRM fonctionnelle pour mesurer l’activité du dentelé antérieur, la fiabilité de cet outil de mesure utilisé selon cette méthode expérimentale est bonne

Malgré le fait que l’IRM fonctionnelle présente l’avantage de fournir des données peu sujettes aux interférences, certains inconvénients sont à considérer. Premièrement, du fait qu’il s’agisse d’une mesure post-tâche expérimentale et qu’il y a un délai entre la contraction musculaire et la mesure d’activité, la latence de l’intensité du signal T2 est questionnable. La littérature ne fournit pas encore de réponse à cette interrogation (Cagnie et al., 2011). De plus, l’IRM fonctionnelle aurait un seuil de détection d’activité plus élevé que l’EMG selon une étude de Segal (2007), revue qui porte sur l’activité de muscles superficiels. Cet élément laisse supposer que l’utilisation de l’EMG serait à privilégier pour les activités de faible intensité.

En conclusion, le choix de ces deux outils de mesure se défend et dépend surtout de l’objectif lié à leur utilisation. Ils doivent être spécifiques à la profondeur du muscle dont l’activité est mesurée. La fiabilité des différentes études sélectionnées est globalement bonne et l’étude menée par Szeto et al. (2005) fait preuve de la meilleure rigueur méthodologique ou du moins rédactionnelle.

Dans le document Altération des muscles stabilisateurs de la scapula et cervicalgie non-spécifique (Page 29-35)