Facteurs liés à la méthode statistique .1 Influence du modèle mathématique

8 DES LIMITES DES TECHNIQUES D'ÉVALUATION DE L'ÂGE

8.1 À PROPOS DE L ' ÂGE OSSEUX

8.1.3 Facteurs liés à la méthode statistique .1 Influence du modèle mathématique

Dans leur article très orienté sur la méthodologie statistique, AYKROYD ET COLL. ⁽¹¹⁾ démontrent que le défaut commun à presque toutes les études, qui consiste en une attraction par le milieu des âges estimés (âge estimé trop vieux pour les jeunes et trop jeune pour les plus âgés), provient de l'analyse par régression*

généralement utilisée.

8.1.3.2 Taille de l'échantillon

Quand bien même la taille de l'échantillon de certaines études semble suffisamment grande pour assurer une puissance statistique suffisante, le morcellement en sous-groupes peut permettre de douter des conclusions de ces études. Par exemple, LÉONETTI ET COLL. ⁽¹²⁹⁾ ont bien 292 crânes à disposition pour leur étude de la variation de l'angle sphénoïdal entre 15 et 90 ans (par tranche

d'âge de 5 ans, soit 15 tranches) mais cela pour 2 populations d'origine différente (Afrique/Europe) et pour 2 sexes. Ainsi au mieux, dans leur tranche d'âge la plus nombreuse (35-39 ans, 40 sujets) on peut s'attendre en moyenne à 10 sujets par sous-groupe et dans les trois tranches les moins dotées (15-19 ans, 3 sujets; 85-90 ans, 10 sujets; 75-79 ans, 16 sujets) respectivement 0,75, 2,5 et 4 sujets!

De même, KOC ET COLL. ⁽¹⁰⁷⁾ qui soutiennent l'existence d'une différence de maturation entre leur échantillon de garçons turcs âgés de 7 à 17 ans par rapport aux standards de GP n'ont que 11 sujets dans la catégorie d'âge 7 ans, 13 dans celle de 16 ans et 4 dans celle de 17 ans.

8.1.3.3 Taille de la tranche d'âge

De celle-ci dépendra la précision de la méthode : plus la tranche d'âge est petite plus l'âge estimé s'approchera de l'âge chronologique. Cependant cela nécessite un échantillon nettement plus grand au départ. En fonction de l'objectif de l'estimation de l'âge, certaines études comme celles de LÉONETTI ET COLL. ⁽¹²⁹⁾ (tranche d'âge de 5 ans) ou de KOBYLIANSKY ET COLL. ⁽¹⁰⁶⁾ (tranche d'âge de 10 ans) pourront (anthropologie) ou ne pourront pas (estimation de l'âge entre 16 et 21 ans pour la médecine légale) être directement utilisées.

Finalement, lors de l'établissement d'une méthode d'analyse statistique, on peut se demander s'il ne vaudrait pas mieux s'en tenir au nombre de jours des sujets ce qui aurait l'avantage de travailler avec une variable continue plutôt que discrète.

8.1.3.4 Précision et intervalle de confiance

Comme précédemment mentionné, la précision est tributaire de la tranche d'âge utilisée dans l'étude à laquelle on fait référence. D'autre part et comme l'estimation de l'âge se base sur des modèles statistiques, il faut garder à l'esprit que l'âge estimé selon une méthode donnée (et pour autant que la distribution de l'échantillon montre une distribution normale) comporte une marge d'erreur (comme la déviation standard) qui est d'autant plus grande que la probabilité que l'âge estimé soit correct (soit l'intervalle de confiance) est grande. Il est donc très important d’en tenir compte lors d'une estimation d'âge. Par exemple en prenant la méthode quantitative d'A^TTALLAH & M^ARSHALL ⁽¹⁰⁾ utilisant la longueur des membres (selon leur exemple : garçon avec bras de 27 cm, avant-bras de 21,5 cm et jambe de 34 cm l'âge estimé = -9,25 + 0,39x21,5 + 0,35x34 + 0,03x27 = 11,9 ans) et pour un âge d'un garçon estimé à 11,9 ans la déviation standard est de

±0,99 ans. Ceci veut dire, comme la distribution est de type normal dans leur étude, que ce garçon a 68% de chance (=intervalle de confiance) d’avoir un âge de 10,91 à 12,89 ans ... et 32% de chance d'avoir un âge en dessous de 10,91 ans ou en dessus de 12, 89 ans. L'estimation* de l'âge à l'aide de cette méthode est relativement précise (1,98 ans de marge d'erreur) mais sans forte probabilité d'avoir un résultat correct. On peut améliorer cette probabilité en augmentant la marge d'erreur en prenant dans cet exemple deux déviations standard. La marge d'erreur est maintenant de 3,96 ans mais la probabilité que l'estimation soit correcte (l'intervalle de confiance) est de 95% (il n'y a donc que 5% de risque que l'âge estimé soit inférieur à 9,92 ans ou supérieur à 13,88 ans). On reconnaît donc la limite de prédiction d'une étude en fonction de la marge d'erreur et de l'intervalle de confiance annoncé. D'autre part, comme le relèvent GROELL ET COLL. ⁽⁷⁹⁾, la sous estimation de l'évaluation de l'âge généralement retrouvé par comparaison aux standards GP, et généralement imputée à l'origine ethnique différente des sujets (comparé à ceux de GP), lorsqu’elle est inférieure à une année, reste dans la marge d'erreur de la méthode GP qui tient compte de la variabilité intra-individuelle.

8.1.3.5 Confirmation de résultats, comparaison entre méthodes

En général, d'après BULL ET COLL. ⁽³⁰⁾ si une étude longitudinale doit être réalisée, elle devrait toujours utiliser exactement la même méthode d'évaluation de l'âge osseux.

8.1.3.5.1 Nouvelle méthode

Typiquement, dans cette situation, la difficulté est de pouvoir confronter les résultats obtenus à ceux établis par une étude de référence. En l'absence d'une telle comparaison, les résultats de la nouvelle technique ne devraient être considérés que comme expérimentaux ⁽⁸²⁾. De plus, en cas de méthode totalement différente des méthodes usuelles, comme par exemple l'évaluation par l’étude de la propagation des ondes US ⁽¹⁰⁴⁾, on peut se demander quelle méthode pourra servir de comparaison sachant que déjà pour des méthodes similaire comme TW2 et Fels certains auteurs s'accordent pour dire que, en plus des différences de méthodologie statistique, il existe des différences relatives au système de score rendant la comparaison non pertinente ⁽²⁵¹⁾.

8.1.3.5.2 Entre méthodes observant les mêmes zones

MILNER ET COLL. ⁽¹⁶⁰⁾ ont comparé la méthode de l'atlas GP et la méthode des scores TW2 et ont retrouvé un âge estimé sensiblement plus jeune que l’âge réel avec la méthode de GP (de 0,9 à 1 an) dans leur échantillon de 58 filles et 66 garçons britanniques (2 à 16 ans). Ceci est une fois de plus imputé à la différence d'origine socio-économique des échantillons, alors qu'une telle valeur de différence s'inscrit dans la variabilité intra-individuelle selon GP ⁽⁷⁸⁾.

D'autre part, si l'objectif est de comparer des méthodes d'évaluation de l'âge, alors il serait raisonnable, d'après GILLI ⁽⁷⁶⁾ de tester des méthodes appliquées sur des échantillons de populations provenant de milieu socio-économique identique ce qui n'est , par exemple, pas le cas pour GP (population aisée avec en général estimation de l'âge plus jeune que réel), TW (population défavorisée avec âge évalué plus âgés que réel) et Fels (population de classe moyenne avec maturation intermédiaire par rapport à GP et TW).

Enfin dans cette dernière situation, la méthode statistique de la comparaison joue aussi un rôle important. Ainsi BULL ET COLL. ⁽³⁰⁾ ont comparé GP et TW2, non pas à l'aide du classique coefficient de corrélation* qui provient d'une analyse de régression (et qui est bon, r=0,96 pour eux), mais à l'aide d'une méthode de dispersion des résultats (dite de "Bland-Altman") qui donne une différence de l'âge osseux à l'âge réel de 2,28 à -1,52 pour un intervalle de confiance à 95%. Ceci démontre que les résultats de chaque méthode ne sont pas vraiment comparables entre eux, ce qui sous entend que les méthodes ne le sont pas davantage.

Dans le document Des méthodes d'évaluation de l'âge d'un être humain (Page 126-129)