• Aucun résultat trouvé

Qualité du reporting des études sur les délais diagnostiques : revue systématique en pédiatrie

3. Résultats 1 Articles

Nous avons identifié 568 articles en remontant d’octobre 2011 jusqu’à janvier 2005. Nous avons retenu 50 articles remplissant les critères d’inclusion (cf. diagramme de flux, Figure 5, page 77).(26,28–31,33–35,37,71–111) Les affections étudiées étaient très variables mais 4 étaient récurrentes : cancer (n=10), accident vasculaire cérébral (n=5), lésions traumatiques (n=4) et maladie de Kawasaki (n=4). Les caractéristiques générales des revues et des articles sont détaillées dans le Tableau 2 (page 77). Au total, 37 (74%) articles rapportaient dans leur conclusion qu’une action corrective était nécessaire pour réduire le délai diagnostique de l’affection étudiée. Dans aucun article, les auteurs ne mentionnaient l’utilisation d’une reporting guideline pour rapporter leur étude.

Partie I – Chapitre 1

3.2 Qualité du reporting

Les résultats de l’évaluation de la qualité du reporting des 50 études incluses sont présentés dans le Tableau 1 (page 75). Les items génériques étaient très souvent rapportés alors que les items plus spécifiques des études sur les délais diagnostiques étaient rarement rapportés. Moins de 50% des articles ont rapporté de façon complète la définition des dates T0 et Tx entourant le délai diagnostique. Quatorze articles (28%) ont listé les symptômes d’alerte pouvant conduire au diagnostic et 2 (4%) ont précisé que tous les sujets présentant le symptôme d’alerte avaient systématiquement bénéficié de la procédure diagnostique lors de la période de l’étude. Deux articles ont rapporté l’ensemble des 11 items considérés comme critiques.(37,101)

3.3 Déterminants potentiels de la qualité du reporting

Les items 22 (délai moyen ou médian) et 11 b (définition du moment précis du diagnostic Tx) étaient significativement plus renseignés au fil des années (de 0 et 1 article sur 3 en 2005 à 8 et 6 sur 9 articles en 2011 respectivement, p < 0,02). Nous n’avons pas mis en évidence de tendance significative pour les 3 autres items (p > 0,2). Nous n’avons mis en évidence aucune association significative (p > 0,1) entre les 5 items sélectionnés et le facteur d’impact ou la spécialité du journal (pédiatrique versus non pédiatrique).

4. Discussion

4.1 Principaux résultats

Cette revue systématique nous a permis d’identifier plusieurs faiblesses dans le reporting des études sur les délais diagnostiques. La qualité du reporting était bonne pour les items génériques mais bien moindre pour les items plus spécifiques aux études sur les délais diagnostiques. Seulement 14 articles (28%) ont listé les symptômes d’alerte et seulement 2

Partie I – Chapitre 1

(4%) ont précisé que tous les sujets présentant le symptôme d’alerte avaient systématiquement bénéficié de la procédure diagnostique durant la période d’étude. Par ailleurs, la précision et la transportabilité de la mesure du délai diagnostique étaient limitées par l’absence de définition explicite des dates de début de la maladie et du diagnostic dans la moitié des articles. Ces défaillances dans le reporting limitent la possibilité d’évaluer les risques de biais et d’obstacles à la transportabilité des études au risque d’entraîner une interprétation erronée des résultats.

L’amélioration avec le temps de l’information disponible pour certains items de notre checklist (la date du diagnostic et le délai diagnostique moyen ou médian) indique qu’une

optimisation du reporting est possible. De plus, le fait que 2 des articles rapportaient correctement l’ensemble des 11 items de notre checklist considérés comme critiques montre également qu’un reporting de bonne qualité (complet) est envisageable.

Nous n’avons pas mis en évidence d’association entre le facteur d’impact des journaux publiant les études incluses et la fréquence de reporting d’items clefs. Ce résultat pouvait suggérer l’existence d’un manque général de connaissance ou d’une sous-estimation des risques de biais et d’obstacles à la transportabilité liés à ce type d’étude mais un manque de puissance était aussi possible compte-tenu du petit effectif de notre étude.

Enfin, près de deux tiers des articles (37/50) concluaient qu’une action corrective était nécessaire pour réduire les délais mais très peu rapportaient les arguments pour justifier un tel plan d’action. Les arguments attendus étaient le fait que le délai diagnostique soit « long » ou qu’un retard diagnostique soit « trop fréquent » ou évitable notamment par l’identification de déterminants. Une action correctrice devrait également être justifiée par la mise en évidence de conséquences néfastes en terme de morbi-mortalité du délai ou retard diagnostique. Enfin pour garantir une action correctrice pertinente il faudrait que les auteurs rapportent une

Partie I – Chapitre 1

glissement dans les articles relève du phénomène de spin, c’est-à-dire de surinterprétation des résultats, récemment décrit.(112)

4.2 Justification des items

La checklist que nous proposons est constituée d’items nouveaux et originaux pour évaluer la qualité du reporting d’aspects méthodologiques particuliers des études sur les délais diagnostiques. Parmi les 35 items que nous avons utilisés, certains sont communs à tous les types d’études observationnelles et tous ne sont pas reliés à des informations nécessaires pour évaluer les risques de biais ou d’obstacles à la transportabilité. Certains items génériques permettent de vérifier la pertinence de l’étude (items 2-4), de vérifier que les auteurs ont bien répondu à la question de recherche en évitant le spin (items 1, 26, 23 et 32) ou de vérifier la précision des résultats (item 17) ou la puissance de l’étude (item 18). D’autres items sont plus spécifiques de l’étude des délais diagnostiques. Nous avons ainsi spécifié 21 items parfois optionnels car dépendants des objectifs de l’étude mais permettant de souligner des points importants pour l’interprétation et l’application clinique des résultats (item 19, 24-25, 31 et 33). Enfin parmi ces 21 items, 11 nous ont semblé indispensables car reliés à des points méthodologiques critiques (items 7-9, 11, 13-15, 22, 28-30). Ces items avaient été décrits et illustrés dans l’introduction de cette partie I (page 47).

4.3 Limites de l’étude

Moher et coll. ont mis en évidence, en étudiant les checklists et échelles d’évaluation de la qualité du reporting des essais randomisés contrôlés, que les items qui les composaient étaient très peu souvent justifiés par leurs auteurs. Nous n’avons pas pu faire la démonstration de l’existence des biais dans les études sur les délais diagnostiques du fait du nombre limité d’études évaluant le délai diagnostique de la même maladie dans un contexte clinique

Partie I – Chapitre 1

comparable et du fait que moins de deux tiers des études rapportaient de façon explicite un délai de façon quantitatif (moyen ou médian) ou une fréquence de retard diagnostique. Nous avons donc justifié nos items en nous appuyant d’une part sur des risques de biais et d’obstacles à la transportabilité déduits d’autres types d’études partageant potentiellement ces éléments (113,114) et d’autre part sur l’expérience de notre équipe de recherche dans le domaine des délais diagnostiques (cf. introduction de cette partie I, page 47).(19,22,23,36– 38,115) Certains items de notre checklist dépassaient le cadre du reporting des éléments méthodologiques pouvant influencer la qualité des études. En effet, les items concernant le plan d’action (items 33, 34, 35) se rapportent plus aux perspectives des études sur les délais diagnostiques et permettent plutôt d’évaluer le risque de sur-interprétation des résultats. Nous verrons dans le chapitre 3 de cette partie I que ces items seront critiqués par le panel international d’experts mis en place pour les valider.

Notre étude était limitée aux études publiées en langue anglaise ce qui a pu amener un biais de sélection dont le sens et la force ne peuvent être anticipés.(116,117) Par ailleurs, la mise en évidence des déterminants de la qualité a pu être limitée par un manque de puissance statistique liée au faible effectif. Enfin, notre étude était limitée à la littérature pédiatrique qui n’est probablement pas le reflet de l’ensemble de la littérature médicale. Il est cependant difficile de prévoir dans quel sens la restriction de l’étude à la population pédiatrique, particulièrement à risque de délais diagnostiques longs, aurait pu influer sur l’estimation de la qualité du reporting.