• Aucun résultat trouvé

4. SisFrance

4.1. SisFrance en question

Les propos qui suivent ne sont pas sans rappeler ceux de J. Vogt dans plusieurs de ses publications qui appelait de ses vœux certains changements. Il n’est pas question ici de dénigrer le travail effectué par le passé, mais bien plus d’exposer une argumentation quant à la nécessité de modifications à venir.

SisFrance est le fruit d’un long processus : construite sur les fondations de la base SIRENE, elle est cogérée par trois institutions nationales et soutenue par le Ministère de l’Ecologie et du Développement Durable. La partie métropolitaine contient ainsi 88.000 observations se référant à près de 6.000 séismes pour la période 463-2001 et plus de 9.000 référence bibliographiques. La partie Antilles contient 4.900 IDP se référant à 2.600 séismes dans les départements français de la Guadeloupe, de la Martinique et de la Guyane française pour la période 1495-2001 pour plus de 400 références. Parmi les autres points méthodologiques, la contextualisation n’est pas mentionnée. Le groupe initial devait gérer des problèmes dus à l’obsolescence des compilations. Cela illustre les limites, qui forment des biais et créent des incertitudes. Lorsque les sources sont récoltées, l’estimation de l’intensité durant le premier niveau d’interprétation résultait de : 1. La classification des bâtiments (classe et degré de dommage) et 2. Une analyse statistique de la distribution du degré de dommage pour chaque classe de bâtiment. De cette façon les intensités étaient estimées selon la méthode statistique proposée par l’échelle macrosismique MSK 64, divisée en 12 degrés. Le second niveau d’interprétation considérait que les aires isoséistes étaient "plotted by hand, ensuring the exclusion of abnormal intensities. The epicentral coordinates are computed using the barycentre of the isoseismals of maximal intensities (Imax or Imax -1)” (« sont places à la main, prenant en compte les

intensités anormales. Les coordonnées de l’épicentre sont calculées en utilisant le barycentre des isoséistes d’intensité maximale »). Si des incertitudes subsistaient à l’attribution des intensités, alors elles étaient converties en demi-degrés (par exemple VII-VIII pour 7,5) et accompagnées d’un indice de qualité plus faible. Un autre point concernant SisFrance, est

“the originality of this parametric database: the attribution of reliability coefficients at all levels of interpretations going from the documentary sources to the final intensity estimate. Concerning the documentary sources, reliability coefficients have been attributed based on a number of criteria (original source or copy, direct or indirect testimony, level of precision and of exaggeration)” (« l’originalité de cette base de données paramétrique : l’attribution de coefficients de fiabilité à tous les niveaux d’interprétation allant des sources documentaires à l’intensité finale estimée. Concernant les sources documentaires, les coefficients de fiabilité ont été attribués sur la base d’un nombre de critères (source originale ou copie, témoignage direct ou indirect, niveau de précision et l’exagération »).

Il est irréfutable qu’un énorme travail a été fait, comme le montrent O. Scotti & al. Ils mentionnent également en perspectives que la distinction entre sources primaires et sources secondaires devra être améliorée. Restait alors à remplir un dernier challenge concernant cette fois des stratégies visant à améliorer les connaissances des évènements d’intensités élevées (supérieure à VI) pour lesquels peu d’observations étaient disponibles.

Cette construction de la base de données représente un exemple des limites qu’impose ce type de projet titanesque : outre le traitement des données, c’est l’architecture même de la base qu’il faut penser au préalable de façon à pouvoir l’interroger ensuite et sur une longue période sans

« Les vieux fondements de la critique textuelle ou de la critique historique ne sont pas à balayer, mais à réécrire, en fonction de [ces] nouvelles perspectives ».

73

qu’elle ne périclite de par sa structure inadéquate. Le schéma que l’on trouve dans l’article qui reprend les différentes étapes de création de SisFrance montre également les limites techniques auxquelles ont dû faire face le groupe de travail. Ces limites amputent à la façon d’un Procuste202 les possibilités offertes par la structure relationnelle de la base de données.

Figure 16 : Architecture de SisFrance lors de sa création. Source : SCOTTI O. & al., 2004.

La base de données présente donc pour l’heure plusieurs éléments interrogeables : le numéro de chaque évènement, sa date, son intensité épicentrale, la localisation des IDP et des intensités liées avec un indice de fiabilité pour la localisation et l’intensité. Sont également disponibles les numéros attribués à chaque document avec un indice de fiabilité pour l’analyse de chacun d’entre eux. Les requêtes possibles sont dès lors les suivantes : combien SisFrance contient- elle d’évènements d’intensité N (pour le chiffre choisi) pour une année ou une période ? Combien contient-elle de documents d’indice de fiabilité Y (pour l’indice choisi) pour une année ou une période ? Combien d’évènements se sont produits en fonction des localités ? Combien de documents sont-ils disponibles pour ces mêmes localités ? Toutes ces requêtes peuvent s’avérer très intéressantes dans la mesure où un chercheur souhaite affiner la complétude de la base de données ou d’un évènement en particulier, ou encore pour une période donnée.

Le problème qui se pose alors est le suivant : le niveau de détail des informations disponibles n’est pas suffisant pour y répondre clairement et ainsi promouvoir de telles études. En l’absence de distinction entre sources primaires et sources secondaires, connaître le nombre de chaque type de documents est impossible. Or c’est une information qui s’avère des plus utiles pour les décisionnaires : c’est en effet en fonction du nombre de sources primaires et de leur qualité qu’est décidée une étude

202

Procuste était un brigand de la mythologie grecque qui étendait ses victimes sur un lit trop court et coupait ensuite les bouts qui dépassaient. C’est tout un pan des requêtes qui est amputé ici par l’absence de renseignements divers concernant les documents inclus dans SisFrance.

74

visant à chercher de nouveaux documents. Dans cette optique la méconnaissance de la nature des documents (registres paroissiaux, actes notariés, correspondances, etc.) limite les champs d’investigation : si pour un évènement donné le nombre de registres paroissiaux est relativement élevé mais qu’ils délivrent peu d’informations, il est alors pertinent de se tourner vers des natures de documents différentes (administratives, privées, économiques…) qui sont moins facilement accessibles. Mettre en relation la distribution spatiale des documents et leur nature est primordial pour une connaissance homogène de l’évènement au niveau régional.

A terme ces connaissances recueillies pourraient permettre l’établissement de moyennes relatives à chaque nature de documents afin de considérer la recherche comme « économiquement complète203 » et passer à des documents d’autres natures. Enfin, la distinction entre lieu de publication et lieu d’édition des sources n’étant pas claire, il est actuellement impossible d’effectuer des analyses spatiales pour le parcours de l’information. Une lettre publiée à Paris rapportant des faits qui se déroulent à Bordeaux pose problème actuellement : l’intensité est calculée pour Bordeaux alors que l’information provient de Paris.

Cette provenance de l’information informe le chercheur sur le parcours qu’a emprunté l’information depuis l’origine du séisme jusqu’à la personne qui le rapporte. Dans le cas présent cela signifie qu’au moins une personne a colporté des nouvelles de l’évènement. Qu’il le fasse lui-même ou qu’il transporte une lettre, dans les deux cas il a connaissance de l’évènement puisqu’il a réceptionné la lettre pour l’acheminer. Il était donc présent sur les lieux et a pu en entendre parler, donc a pu transmettre l’information sur le chemin. L’emplacement des relais aux postes le long des grandes voies du réseau routier peut ainsi aider à orienter les recherches pour trouver de nouveaux documents. Le processus est moins hasardeux au niveau local lorsque le chercheur est en présence de copies : suivre les routes qui mènent de l’une à l’autre source peut indiquer des localités pour lesquelles aucune information n’est disponible et ainsi rendre intéressant un contrôle.

Ces requêtes, recherches et leurs traçabilités inhérentes rendent cohérentes des recherches afin d’améliorer les connaissances d’évènements peu connus ou pour lesquels ce genre d’études n’a pas encore été lancée. C’est la complétude et la robustesse qui sont ici en jeu, deux concepts chers aux décisionnaires.