• Aucun résultat trouvé

Liste des tableaux Tableau 1 : Effectifs des dents prélevées par types dentaires

2. M ATERIEL &

2.2.5 A NALYSES STATISTIQUES

Les données ont été saisies sous Microsoft® Excel, puis importées et analysées sous IBM® SPSS Statistics (Version 24.0, IBM® SPSS, Chicago, IL) pour Apple®. Une représentation des variables et des liens explorés par les méthodes statis-tiques est présentée dans la figure 22.

Les statistiques descriptives incluent, pour les variables qualitatives, ordinales ou nominales, les fréquences et les proportions et, pour les variables quantita-tives, les mesures de tendance centrale et de dispersion, à savoir la moyenne [𝑥], la médiane [Md], l’écart-type [𝜎], les valeurs minimum [Vmin] et maximum [Vmax] (Zar, 2010).

La précision des estimations a été évaluée par l’analyse de la dispersion des comptes manuels et semi-automatiques d’annuli. L’imprécision absolue des estimations de l’âge au décès a été analysée par l’examen de la distribution des écarts-types des comptes [𝜎]. L’imprécision relative a été appréciée au moyen du coefficient de variation [CV] qui, sur des mesures répétées, représente une mesure de la fiabilité, ainsi que par le calcul du pourcentage moyen d’erreur [APE] (Beamish et Fournier, 1981) et du coefficient de variation modifié [CV2] (Chang, 1982) qui permettent l’évaluation de la reproductibilité. L’exactitude des esti-mations de l’âge a été appréciée par l’examen de l’incertitude absolue (ou erreur absolue) définie par l’écart entre la valeur estimée et la valeur vraie et par l’incertitude relative (ou pourcentage d’erreur) exprimée par l’écart entre les valeurs estimées et réelles par rapport à la valeur de l’âge documenté. La va-riance des indicateurs de précision et d’exactitude a été explorée par des mo-dèles de régressions multiples.

L’évaluation de la fidélité intra-observateur, donc la concordance entre les dé-comptes sur un même sujet par le même évaluateur (Elie et Colombet, 2011), a été effectuée. Un sous-échantillon de cinquante micrographies réalisées sur des sujets d’âge connu a été sélectionné au hasard pour faire l'objet d’un nouveau décompte manuel des annuli de cément acellulaire. Cette sélection, correspon-dant à 25% de l'échantillon d’individu d’âge connu et à 12,5% de l’échantillon total, représente, selon Buikstra et Ubelaker (1994), une valeur raisonnable pour évaluer l’erreur intra-observateur. La réévaluation des décomptes a été effec-tuée six mois après l’acquisition des données initiales. L'erreur intra-observateur a été évaluée par le coefficient de corrélation intra-classe (Shrout et Fleiss, 1979) et la méthode graphique de Bland-Altman (Bland et Altman, 1986 ; Giavarina, 2015). Ce diagramme de dispersion affiche la différence entre les deux méthodes et fixe les limites de concordance à 𝑥 ± 2𝜎. Ces mêmes méthodes mathématiques et graphiques de l’estimation de la reproductibilité ont été

- Méthodes

pliquées aux comptes semi-automatiques réalisés sous Visilog®. La comparaison des décomptes opérés par l’observateur et par Visilog® a été entreprise à l’aide de la représentation graphique de Bland-Altman (Bland et Altman, 1986). Les variables quantitatives ont été soumises à un test de Kolmogorov-Smirnov (Zar, 2010) pour vérifier la normalité de la distribution. Cette distribution a été explorée au moyen des coefficients d'asymétrie (Skewness) et d'aplatissement (Kurtosis). L'homogénéité des variances au sein de groupes a été évaluée par le test de Levene (Zar, 2010). Pour examiner l'existence d'une relation entre les va-riables catégorielles et quantitatives, nous avons privilégié le test non paramé-trique de Kruskall-Wallis qui représente une alternative à l’analyse de variance ANOVA quand l’hypothèse de normalité ne peut être retenue (Siegel et Castellan, 1988). L'analyse de l'homogénéité et de l'indépendance des variables catégorielles et binaires a été effectuée avec le test de Chi-2 [2] et le détail des liens entre variables catégorielles a été exploré par l’analyse des résidus stan-dardisés. Afin de représenter l’association des variables catégorielles et la proximité de leurs modalités, nous avons exécuté une analyse des correspon-dances multiples [ACM]. Pour les variables continues, une analyse en compo-santes principales [ACP] a été effectuée. La corrélation a été réalisée grâce au coefficient de corrélation de Pearson [r] pour les variables quantitatives et au coefficient rho de Spearman [rho] pour les variables de catégories ordonnées.

Figure 22 : Représentation schématique des données acquises et des liens testés par les méthodes statistiques.

Individus

! Identification ! Collections ; sites ! Sexe

! Age chronologique ! Classes d'âge décennales ! Classes d'âge quinquennales

Période ! Date de naissance ; de décès ; d'inhumation ; d'exhumation ! Datation ! PMI ! Durée d’inhumation Observateur ! Comptes (1 à 5) ! Moyenne

! Imprécision absolue et relative

Ecarts-types! "#Coefficient de Variation CV ; Pourcentage moyen d’erreur APE ; Coefficient de Variation CV2 ! Incertitude absolue et relative

Différence âge estimé /âge réel $%&'#()ourcentage d’erreur $*%&'

Dents prélevées

! Identification FDI

! Lisibilité 1 à 5 ! Indice de lisibilité/dent

Taphonomie

! General Histological Index ! Oxford Histological Index ! Intensité de la biréfringence ! Lame quart d'onde ! Coloration-infiltration ! Fracturation A à F

Visilog

! Comptes (1 à 101) ! Moyenne

! Imprécision absolue et relative

Ecarts-types!#( Coefficient de Variation CV ! Incertitude absolue et relative

Différence entre âge estimé / âge réel $%&'#(# "ourcentage d’erreur $*%&' Modèlisation ! Modèles de regressions linéaires Âges individuels Tables de prédictions ! Vecteur de probabilité Âges populationnels Matrices de fréquences

-

La nature et la force de la relation entre la variable réponse (ou dépendante) (e.g. âge chronologique) et la variable prédictive (ou indépendante) (e.g. comptes

d’annuli) sont étudiées au moyen de régressions linéaires. Le coefficient de

déter-mination [R²] a été déterminé pour vérifier l'adéquation entre le modèle de ré-gression et la variable considérée et la validité du modèle a été testée par l’analyse des résidus (normalité, linéarité, homoscédasticité). Ces régressions linéaires ont été réalisées avec et sans l’ajout d’une variable de pondération. L'examen des outliers a été entrepris par l’analyse de la distance de Cook. Les intervalles de prévision pour une réponse prévue par le modèle ont été cons-truits avec des niveaux de confiance de 75, 80, 85, 90, 95 et 99%.

Les distributions probables du nombre d’annuli par classe d’âge au décès ont été calculées et ont servi de base à la réalisation de matrices de probabilités de la collection de référence. La méthode ALK (Age Length Key) (Konigsberg et Frankenberg, 1992) ou des vecteurs de probabilité (Masset, 1982), a été adoptée pour estimer la matrice d’une population inconnue.

Pour les analyses inférentielles, la significativité statistique a été admise pour p≤ 0,05.

La précision ne peut pas être le reflet de l’exactitude. Par conséquent, précision et exactitude sont d’abord traitées séparément dans ce chapitre, avant d’être confrontées.

La mesure de la précision, ou de l’imprécision, est un moyen efficace pour apprécier la facilité relative d’une estimation de l’âge, évaluer la reproduc-tibilité des analyses et comparer les dispersions au sein de différents groupes d’individus. Les erreurs de précision peuvent être biaisées ou aléatoires selon que les facteurs qui en sont à l’origine se produisent constamment ou sporadi-quement. Afin d’explorer l’imprécision des estimations, nous avons étudié le comportement d’un indicateur de l’imprécision absolue exprimée par les écarts-types des comptes d’annuli du cément acellulaire et d’un indicateur de l’imprécision relative des comptes exprimée par le coefficient de variation. Deux autres mesures de l’imprécision relative communément utilisées en biolo-gie marine ont été adoptées : le pourcentage moyen d’erreur et le coefficient de variation modifié. L’exactitude des estimations de l’âge au décès, ou l’incertitude, traduit la qualité de l’accord de l’estimation et de la valeur de l’âge documenté. Les écarts entre valeurs estimées et valeurs vraies ont été évalués au moyen d’indicateurs d’incertitude absolue et relative qui permettent d’apprécier la justesse des estimations. L’influence sur ces indicateurs de para-mètres intrinsèques, tels que l’âge ou le sexe et extrinsèques, tels que les affec-tions taphonomiques ou l’intervalle post mortem, a été explorée au moyen de modèle de régressions multiples puis la précision et l’exactitude des estimations a été décrite pour chaque groupe composant le référentiel. Ces indicateurs de précision et d’exactitude reposent sur la capacité de l’opérateur à obtenir à dif-férents moments un résultat identique sur le même échantillon. Cette reproduc-tibilité est essentielle et la concordance entre les comptes d’annuli a été éprou-vée pour l’opérateur ainsi que pour le système d’analyse semi-automatisé déve-loppé sous Visilog®. La dispersion des comptes du logiciel ainsi que l’accord entre valeurs estimées et valeurs réelles ont été explorés avec les mêmes indica-teurs d’imprécision et d’incertitude que ceux adoptés pour l’observateur. Ce choix d’outils identiques permet la comparaison directe des aptitudes du logi-ciel et de celles de l’opérateur.

Des modèles de régressions linéaires ont permis d'examiner la relation entre l’âge chronologique et les comptes d’annuli et de s’affranchir de l’imprécision

- Précision des comptes d’annuli

non chiffrée de l’âge de l’éruption de la dent et de calcification de la racine sur lequel reposent pourtant les études cémentochronologiques ordinaires. Ces modèles ont permis le calcul d’intervalles de prévision à différents niveaux de confiance et la conception de tables de prédiction pour de nouveaux sujets d’âge inconnu. Les distributions des fréquences d’annuli par classe d’âge au décès ont permis d’obtenir des matrices de probabilités pour la collection de référence. La modélisation et les vecteurs de probabilité ont été appliqués à deux collections archéologiques en suivant deux approches distinctes, l’une individuelle et l’autre populationnelle.

3.1! P

RÉCISION DES COMPTES D

ANNULI

Sur l'ensemble des dents sélectionnées pour l’étude, l’intégralité [100%" ; n=400], a permis la réalisation des cinq préparations histologiques prévues par

le protocole standardisé que nous nous sommes imposé. Ainsi, 2000 lames his-tologiques dentaires ont été intégrées à ce travail doctoral.

Lors de l'interprétation et du dénombrement des annuli du CAFE, il est néces-saire d’effectuer plusieurs comptes sur les différentes préparations histolo-giques de façon à réduire la part de subjectivité propre à l’observateur.

Sur les 400 dents, 82,8% [n=331/400] ont permis d’effectuer les dénombrements d’annuli sur chacune des cinq lames" ; 6,8% [n=27/400] ont permis de réaliser quatre dénombrements" ; 1,3% [n=5/400] ont permis de compter les alternances de trois des lames" ; 5% [n=20/400] ont permis de réaliser deux comptes. Enfin, 4,3% [n=17/400] n’ont permis ce décompte que sur une seule préparation (Tableau 3). Ainsi, les préparations histologiques ont permis d’effectuer 1835 dénombrements sur les 2000 envisagés. Les raisons de l’impossibilité de ces comptes sont variées, mais ne sont pas liées à des complications de préparation. Nous aborderons les raisons de ces impossibilités dans les parties dédiées à la lisibilité et aux affections taphonomiques.

La moyenne arithmétique des comptes d’annuli est la mesure de tendance cen-trale rencontrée le plus fréquemment en cémentochronologie puisque c’est sur cette valeur que reposent les estimations de l’âge au décès. Mais une simple

Tableau 3 : Nombre de comptes d'annuli effectués pour chaque dent.

- Précision des comptes d’annuli

moyenne ne rend évidemment pas compte de la dispersion des décomptes ef-fectués sur une dent ni du niveau d’accord entre les lectures. L’intervalle com-plet de la distribution des dénombrements est rarement exprimé dans la littéra-ture. Il est même amputé lorsque certains auteurs se risquent à éliminer les va-leurs extrêmes de comptes (vava-leurs minimales et maximales). Plusieurs indica-teurs permettent de déterminer le niveau d'accord entre les lectures et donc d’apprécier la précision. Ces indicateurs de l’imprécision, relatifs et absolus, sont ici analysés.