• Aucun résultat trouvé

F3 L A DISTRIBUTION PAR AGE DE L ’ ECHANTILLON DE REFERENCE : UN CHOIX IMPORTANT

INDICATEURS, MATERIEL, TRAITEMENT DES DONNEES : DES CHOIX DIFFICILES

F3 L A DISTRIBUTION PAR AGE DE L ’ ECHANTILLON DE REFERENCE : UN CHOIX IMPORTANT

a) la distribution par âge : un biais majeur

En dehors du choix d’une population de référence appropriée à notre stratégie, un paramètre fondamental de l’échantillon de référence est sa distribution par âge. Cette distribution peut être un biais grave dans l’application des méthodes de l’estimation de l’âge au décès (Masset, 1976a ; Bocquet-Appel et Masset, 1977, 1982, 1985, 1996). L’effet de la distribution par âge est minime si la corrélation entre l’âge chronologique et l’indicateur de l’âge est proche de 0.9 (Bocquet-Appel et Masset, 1982, 1995 ; Masset, 1993 ; Rösing et Kvaal, 1998), ce qui n’est jamais le cas, ou si la distribution par âge est similaire entre la population de référence et la population dont on veut connaître la structure par âge (Masset, 1976b ; Konisberg et Frankenberg, 1992), mais ce paramètre est toujours inconnu.

Le problème des biais introduits par la distribution par âge de la population de référence a été parfaitement décrit par Bocquet-Appel et Masset (1982). A chaque stade d’évolution d’un indicateur correspond un âge moyen de la population de référence. Cette moyenne n’est pas biologique par nature, elle dépend beaucoup de la structure par âge de la population de référence. Si une régression linéaire est utilisée pour lier l’indicateur et l’âge chronologique, on s’aperçoit que la droite de régression est mobile et que cette mobilité dépend de la distribution par âge de la population. Si la population de référence est plus ou moins déséquilibrée en jeunes ou en vieillards, l’âge moyen estimé pour une population archéologique à partir d’un indicateur sera différent selon la population de référence (Bocquet-Appel et al., 1978). Par conséquent, lorsqu’une méthode est appliquée, le résultat de

la distribution par âge estimé a tendance à ressembler à celui de la population de référence. La fonction ne duplique pas l’échantillon de référence mais produit un échantillon biaisé en direction de l’échantillon de référence (Konisberg et Frankenberg, 1992). Ce problème a fait l’objet de débats (Bocquet-Appel et Masset, 1982 ; Van Gerven et Armelagos, 1983 ; Buikstra et Konisberg, 1985 ; Mensforth et Lovejoy, 1985 ; Buikstra et al., 1986 ; Siven 1991 ; Jackes, 1985, 1992, 1993). Cependant l’influence de la population de référence est maintenant largement reconnue et fait l’objet de nombreuses études pour tenter de l’éviter. En effet, conscient que les indicateurs d’âge ne sont pas fiables et que l’estimation de l’âge individuel est entachée d’erreur, le domaine de la paléodémographie a vu fleurir des méthodes statistiques très sophistiquées pour calculer la distribution par âge d’une population dont l’âge au décès est inconnu sans passer par l’âge individuel au décès.

b) les méthodes itératives

On peut noter, par exemple, les méthodes itératives (iterative proportional fitting) proposées par Konisberg et Frankenberg (1992) et Bocquet-Appel et Bacro (1997). Mais, elles se sont avérées inefficaces pour obtenir la distribution par âge d’une population (Bocquet-Appel et Masset, 1996; Jackes, 2000). Elles sont, en fait, plus adaptées à donner l’âge moyen au décès. Mais, l’étude d’une population de squelettes ne peut se contenter de cette information (Molleson, 1993a ; Hoppa et Saunders, 1998 ; Jackes, 2000). En effet, celui-ci ne reflète pas les différences éventuelles de la structure par âge entre deux populations (Milner et al., 2000). Les méthodes itératives se basent sur le fait que l’échantillon cible est représentatif de la population dont il provient (Chamberlain, 2000). En effet, même si ce n’est pas l’âge estimé de chaque individu qui est pris en compte, la distribution de chaque stade d’évolution d’un indicateur par classe d’âge, regroupée en tableau de contingence, provient des observations faites sur le squelette de chaque spécimen. Les procédures statistiques ne peuvent pas surmonter les limites d’un échantillon biaisé au départ et d’un mauvais indicateur d’âge (Meindl et Russel, 1997) comme le prouve l’étude de Hoppa et al. (1999). La « fitting mixture distribution » ne s’est pas révélée concluante.

c) solutions proposées

Le problème vient du fait que chaque classe d’âge présente toutes les phases d’un même indicateur. Seule la proportion d’individus présents dans chacune des phases varie (Masset, 1990). On ne peut donc pas distinguer les paramètres verticaux, propres et uniques à chaque

classe d’âge et les paramètres horizontaux qui se rencontrent dans plusieurs classes (Bocquet- Appel, 1977).

Pour pallier ce problème, Bocquet-Appel et Masset (1982) et Masset (1982) proposent d’utiliser une population dont la distribution par âge serait uniforme, possédant le même nombre d’individus dans chaque classe d’âge. Dans la réalité, les populations naturelles présentent rarement la même probabilité de mourir dans toutes les classes d’âge. L’uniformité de la distribution par âge est biologiquement impossible et hautement improbable (Buikstra et Konisberg, 1985 ; Konisberg et Frankenberg, 1992).

Ce que l’on cherche à obtenir en étudiant les indicateurs d’âge, c’est p(aθi), la probabilité qu’un sujet meurt à l’âge a étant donné la caractéristique (θi) de son squelette, série de caractères observés sur le ième squelette d’un échantillon de référence (Konisberg et Frankenberg, 1992 ; Konisberg et al., 1994). Or, en étudiant les indicateurs on obtient plutôt p(θia), c’est à dire la probabilité qu’un squelette possède telle ou telle caractéristique en fonction de son âge. Mais ce qu’on veut obtenir, c’est p(aθi). Pour ne pas être influencé par la structure par âge, de la population de référence, il faut inclure f(a), la fonction déterminant la distribution de la population ancienne étudiée, soit la probabilité qu’un individu pris au hasard est l’âge a. On doit définir f(a) a priori.

Une solution est la distribution de l’âge au décès dérivée d’un modèle de mortalité paramétrique (Gowland et Chamberlain, 1999 ; Chamberlain, 2000 ; Milner et al., 2000). Les données a priori doivent prendre en compte un schéma de mortalité réel et connu. Nous proposons d’utiliser les tables de mortalité de Ledermann (1969) avec le choix d’une espérance de vie à la naissance de 30 ans étant donné que les quotients de mortalité sont quasiment identiques que l’on prenne une espérance de vie à la naissance de 20, 25, 30, 35 ou 50 ans (figure II.1).

Figure II.1 : quotients de mortalité en fonction de l’espérance de vie à la naissance(e0)