• Aucun résultat trouvé

2.1 SRUCTURATION ET HIÉRARCHISATION SPATIALE DE L'HABITAT

2.1.2 La typologie hiérarchique de l'habitat : un modèle d'analyse multivariée

2.1.2.1 L'expérience Archaeomedes

2.1.2.1.1 Un outil : l'Analyse Factorielle des Correspondances (AFC) et la Classification Ascendante Hiérarchique (CAH)

"L'AFC est une technique d'analyse factorielle appropriée à l'analyse de descripteurs qualitatifs qui constituent notamment l'essentiel des données archéologiques et pédologiques. Elle est conçue pour permettre la confrontation de la structure des descripteurs et de la structure des observations, dans notre cas les sites archéologiques" (Girardot in Leeuw, dir. 1995 : 4).

D'un point de vue technique, l'AFC mobilise, en entrée, des données qui se présentent sous la forme d'une matrice composée en ligne par des observations statistiques et en colonne par des caractères. Les individus statistiques correspondent, dans notre cas, aux établissements archéologiques. Les caractères représentent les modalités de chaque descripteur ou variable. Par exemple, pour le descripteur ou variable superficie, on distinguera les caractères suivants : superficie non indiquée, superficie inférieure à 0,1 ha … Le codage de l'information qui associe les individus aux caractères peut s'exprimer soit sous la forme de valeurs soit sous une forme booléenne ou binaire, c'est-à-dire absence (0) ou présence (1) du caractère. Si, par exemple, pour un établissement A, le caractère "superficie inférieure à 0,1 ha"est codé 0, le caractère "superficie comprise entre 0,1 et 0,3 ha" est codé 0 et le caractère "superficie comprise entre 0,3 et 0,5 ha" est codé 1, on comprendra alors que cet établissement a une superficie comprise entre 0,3 et 0,5 ha. Dans le cadre de cette étude, seules des matrices booléennes ont été exploitées.

La matrice booléenne permet, après calcul des distances entre individus et caractères, de représenter graphiquement un nuage de points où chaque point représente la position d'un établissement par rapport aux autres dans un espace multidimensionnel en fonction des relations qu'ils entretiennent avec les caractères. Chaque axe de cet espace correspond à une variable, par exemple la superficie. La graduation de l'axe est représentée, par les différentes modalités de la variable, c'est-à-dire par les caractères. La position d'un établissement sur un

axe peut se traduire comme une coordonnée. Classiquement, nous manipulons deux coordonnées dans un espace-plan où l'on croise deux variables, et plus rarement trois dans un espace à trois dimensions où l'on croise trois variables. La position de l'établissement dans l'espace multidimensionnel est tout simplement déterminée par plusieurs coordonnées, autant qu'il y a de variables. Dans ces conditions, les établissements qui ont le même profil, c'est-à- dire qui partagent les mêmes caractères, auront tendance à se rapprocher dans le nuage et inversement à s'éloigner quand leur profil diverge.

Individus statistiques (en lignes) / caractères (en colonnes) S<.1 S<.3 S.3<1 S>1 Occ1 Occ2

Vd004 0 0 1 0 1 0

Vd006 0 0 1 0 0 1

Vd010 1 0 0 0 1 0

Vd011 1 0 0 0 0 1

Vd012 0 1 0 0 0 1

Tableau 3 Extrait du tableau booléen

La lecture d'un graphique à plus de trois dimensions étant impossible pour le cerveau humain, seul le nuage de points apparaît dans la représentation. À ce stade, l'analyse factorielle a pour objectif de mettre en évidence la structure du nuage, c'est-à-dire de l'information, en calculant trois axes factoriels pertinents. Le premier axe est déterminé par l'allongement maximum du nuage, soit "par la droite qui se trouve la plus proche de tous les points simultanément" (Sanders 1989 : 93). Le deuxième et le troisième axe sont calculés de la même manière avec une contrainte d'orthogonalité par rapport aux axes précédents.

L'allongement maximum du nuage étant considéré comme un critère pertinent pour donner du sens à l'information représentée, le lecteur comprendra qu'il est nécessaire de travailler sur un nuage le plus homogène possible. En effet, dans le cas où un caractère concernerait un seul établissement, le profil de ce dernier va se distinguer et s'opposer par sa particularité aux profils des autres établissements. Il va donc se situer en marge du nuage de points et contribuer de manière artificielle à l'allongement de ce dernier en comprimant les autres points à l'opposé du nuage selon un processus qu'on a pu qualifier d'"effet zoom ou unijambiste" (Massonie 1990 : 52, 80-82). En outre, en comprimant les autres individus à l'opposé du nuage, l'individu particulier contribue à amoindrir la variété de leurs profils qui n'est plus perceptible.

Pour éviter ce type de déséquilibre, j'ai choisi d'éliminer certaines variables ou de regrouper certains caractères dont la représentation par région était inférieure à 5% des établissements. Dans la mesure du possible, les regroupements ont été effectués pour obtenir des classes équilibrées en termes d'effectifs (Massonie 1990 : 50) par exemple les deux dernières classes de superficie : "comprise entre 2 et 5 ha" et "supérieure à 2 ha". Toutefois, les regroupements n'ont pas seulement une valeur statistique car nous travaillons sur des

variables qualitatives ou ordinales qui peuvent avoir un sens du point de vue archéologique. C'est le cas par exemple des matériaux de construction où il n'est pas possible de regrouper les modalités "matériaux périssable" et "construction en pierre". J'ai donc tenté d'établir un compromis entre le regroupement significatif des caractères et les contraintes de représentativité statistique. Parfois, j'ai pu conserver des variables en supprimant les caractères trop peu représentés qu'il était impossible de regrouper tout en conservant un sens au caractère, par exemple pour la modalité de superficie non-renseignée. Dans ce cas, j'ai supprimé de l'analyse les individus concernés.

Pour définir les groupes d'établissements qui se ressemblent, c'est-à-dire regrouper dans une même classe les établissements dont le profil est le plus proche, l'AFC est suivie d'une Classification Ascendante Hiérarchique (CAH). Les principes de la CAH sont très simples : "les individus analysés sont progressivement regroupés selon leur degré de ressemblance jusqu'à l'obtention d'une unique classe les regroupant tous" (Sanders 1989 : 180). D'un point de vue technique, il s'agit d'un algorithme qui calcule la distance entre tous les points et agrège les deux points les plus proches. Ces deux points constituent alors un groupe dont on détermine le centre, qui devient le point moyen de ce groupe. L'algorithme calcule ensuite la distance entre ces points moyens et les autres points, et agrège à nouveau ceux qui sont les plus proches. Ainsi, certains groupes intègrent des points supplémentaires et d'autres groupes se créent. L'algorithme permet de poursuivre l'opération jusqu'à l'intégration totale des points dans un même groupe (Chadule 1997 : 163-164). Graphiquement, ces agrégations successives sont représentées par une arborescence dont l'analyse nous permet d'identifier des classes typologiques.

La combinaison de l'AFC et de la CAH nous permet de confronter la typologie des établissements et la structure des descripteurs (Girardot in Leeuw, dir. 1995 : 4-5).

2.1.2.1.2 Une analyse diachronique

Comme nous l'avons souligné le protocole d'analyse repose sur l'expérience du projet Archaeomedes II pour lequel j'ai largement contribué à réaliser les différentes analyses statistiques. Afin d'étudier la dynamique de l'ensemble des établissements protohistoriques, antiques et médiévaux (2155 établissements), la mise en œuvre d'une démarche exploratoire a permis de tester la discriminance et sélectionner certains descripteurs tels que : le statut,

l’influence sur la carte de Cassini et sur le paysage actuel. En effet, ces derniers renseignent

plus particulièrement les établissements gallo-romains et surtout médiévaux, tandis que ceux de l’Âge du Fer sont souvent marginalisés voire ignorés de ce point de vue. Aussi, il était nécessaire de vérifier le poids respectif de chacun de ces caractères dans l’analyse globale. Les premiers traitements de données réalisés sous Archaebase – les tris à plat – nous ont permis d’extraire la répartition des caractères sur l’ensemble du corpus et par région. Ainsi, nous avons pu noter la faible représentativité (moins de 5%), voire l’inexistence de certains caractères dans l’ensemble et surtout dans certaines régions. Ce phénomène a posé dès le départ un problème d’hétérogénéité qui devait conditionner les résultats de toutes les analyses

statistiques envisagées. Pour pallier cette difficulté, nous avons eu recours à des regroupements de caractères afin de travailler sur un corpus adéquat. Ces regroupements ont été soumis aux deux conditions déjà évoquées : un regroupement logique des caractères et, autant que possible, un seuil de représentativité de 5% pour chaque caractère et dans chacune des régions. Ensuite, nous avons procédé en trois étapes correspondant chacune à un traitement statistique (AFC/CAH) avec un éventail de descripteurs variables :

• - AFC 1 : Superficie, Matériaux, Implantations, Durée d’occupation et Occupation antérieure.

• - AFC 2 : les mêmes descripteurs que dans l’AFC 1 associés au descripteur Statut

• - AFC 3 : les mêmes descripteurs que dans l’AFC 2 associés au descripteur Influence sur la carte de Cassini et sur le paysage actuel.

À l'issue de ces différentes analyses, il faut noter que les résultats restent très stables avec une organisation générale de l'information similaire dans chaque cas. Ce phénomène est dû d'une part à l'effet très structurant de deux variables, la superficie et la durée d'occupation et d'autre part aux établissements dont le nombre (plus de 2000) assure une certaine stabilité statistique.

En concertation avec les autres membres de l'équipe, une seule analyse a été retenue afin d'établir la typologie des établissements, il s'agit de "l'AFC 2" comportant les 6 descripteurs archéologiques : superficie, matériaux, date d'implantation, durée d'occupation, occupation antérieure, statut symbolique et politique. Elle est composée de 2155 lignes (établissements) et de 43 caractères en colonne qui correspondent aux différentes modalités regroupées (Annexe 28).

La CAH réalisée sur l'AFC 2 a permis de dégager cinq classes dont l'interprétation a été élaborée à partir d'une description systématique du tri croisé des classes avec chaque descripteur utilisé dans l'analyse (Annexe 29 - ).

• Classe A (456 établissements soit 21%) Petits établissements pionniers protohistoriques, peu durables, sur site vierge, dépourvus de statut symbolique.

• Classe B (874 établissement soit 41%). Petits établissements gallo-romains précoces, plutôt éphémères, sur site vierge, quasiment totalement dépourvus de statut symbolique.

• Classe C (355 établissement soit 16%). Établissements gallo-romains petits à moyens, de facture modeste, de la République et du Bas-Empire, moyennement résistants, plutôt opportunistes, dépourvus de statut symbolique.

• Classe D (179 établissement soit 8%). Établissements gallo-romains et alto-médiévaux de taille moyenne à grande, plutôt résistants, plutôt pionniers, majoritairement dotés d'un statut symbolique ou politique.

• Classe E (291 établissement soit 14%). Établissements médiévaux de grande taille, plutôt durables et plutôt pionniers, quasiment toujours dotés d'un statut symbolique ou politique.

Les cinq groupes obtenus ont permis de classer les établissements selon leur fonction structurante de l'espace territorial. Ainsi, nous pouvons distinguer les habitats dominants que

l'on peut assimiler à des pôles de peuplement qui ont un pouvoir structurant très fort, continu et dont l'expression se manifeste particulièrement à la fin de la période étudiée, c'est-à-dire au Moyen Âge. Ce type d'habitat s'oppose très nettement aux petits établissements éphémères qui colonisent l'espace et le mettent en valeur dès l'Âge du Fer (classe A) et plus singulièrement au cours de la période gallo-romaine (classe B). Entre ces deux formes d'habitat, il faut noter la présence d'établissements moyens dont la fonction structurante est plus difficile à apprécier, notamment selon la période appréhendée. C'est le cas par exemple de la villa gallo-romaine dont on peut se demander si elle fonctionne de manière indépendante ou dans le cadre d'une gestion territoriale plus large (Favory, Raynaud 1999 : 505).

La classification réalisée dans le cadre du programme Archaeomedes montre qu'il existe une forte cohérence entre les différents types hiérarchiques et les périodes de création des établissements. Pour les établissements les plus importants (Classe E) nous pouvons noter une prépondérance de créations médiévales tandis que les classes les plus modestes (A et B) rassemblent essentiellement des implantations protohistoriques et gallo-romaines précoces. La répartition des établissements protohistoriques et républicains selon les différentes classes d'établissement "Archaeomedes" montre que seulement 22% des cas sont associés aux groupes C, D et E. En Languedoc oriental, la hiérarchisation apparaît encore plus forte avec seulement 12% des établissements dans ces classes. Ainsi, il est probable que les établissements protohistoriques et républicains ont été écrasés par les établissements des périodes ultérieures qui sont mieux représentés, en particulier du point de vue de la variété de leurs matériaux de construction et surtout de leur capacité à perdurer. Afin de vérifier la validité de cette hypothèse, nous proposons une nouvelle analyse appliquée aux seuls établissements protohistoriques , période républicaine comprise.