• Aucun résultat trouvé

CHAPITRE 3 M ´ ETHODOLOGIE G ´ EN´ ERALE

3.4 Donn´ ees m´ et´ eorologiques

Les donn´ees m´et´eorologiques obtenues sont issues d’une seule station et sont fournies par le MDDEP dans un format unique, sous la forme d’une lecture par heure pour un ensemble de param`etres. La position de cette station est pr´esent´ee `a la Figure 3.28.

Figure 3.28: Station m´et´eo fournie

Le format se r´esume `a un ensemble de fichiers texte sous forme de colonnes, chacune des colonnes utilisant un nombre pr´ed´efini de caract`eres. Chaque ligne contient un num´ero de station, suivi d’une date, suivi d’un code permettant d’identifier un param`etre et finalement de 24 colonnes repr´esentant les informations pour les 24 heures de cette journ´ee. Une nouvelle ligne signifie la fin des donn´ees pour cette journ´ee et pour ce param`etre. Un fichier d’accom- pagnement permet d’obtenir les codes num´eriques pour identifier les param`etres, ainsi que les unit´es utilis´ees pour chacun de ceux-ci. Le dictionnaire relatant le contenu de chacune des colonnes est pr´esent´e au Tableau 3.6. Les informations compl´ementaires fournies permettent aussi de d´eterminer que les heures utilis´ees repr´esentent la fin des p´eriodes de mesure, et que

l’heure civile est utilis´ee pour l’ensemble des lectures.

Tableau 3.6: Dictionnaire permettant d’interpr´eter les fichiers de donn´ees m´et´eo Position d´ebut Position fin Contenu

1 7 Num´ero de la station

9 12 Ann´ee

14 15 Mois

17 18 Jour

20 24 Num´ero de d´efinition de donn´ee 26 26 Statut d’approbation

28 33 Donn´ees `a 00h HNE

35 35 Statut de la donn´ee de 00h HNE

... ... 6 Caract`eres/1 Caract`ere pour les mesures et leur statut entre 01h et 22h

235 240 Donn´ees `a 23h HNE

242 242 Statut de la donn´ee de 23h HNE

En tout, un ensemble de 83575 mesures de mars 2010 `a mai 2011 a ´et´e obtenu dans un ensemble de 12 fichiers, l’envoi de ceux-ci ayant ´et´e fait en deux parties. La Figure 3.29 pr´esente un ´echantillon du format de donn´ees, alors que le Tableau 3.7 fait ´etat des codes et unit´es des diff´erents param`etres.

Figure 3.29: Forme des fichiers de donn´ees m´et´eo

Comme pour les ensembles de donn´ees pr´ec´edents, un certain nombre de probl`emes concernent les donn´ees m´et´eorologiques fournies. Tout d’abord, toute automatisation devra, d’une fa¸con semblable aux donn´ees de qualit´e de l’air, g´erer la probl´ematique des change- ments d’heure, l’ensemble des donn´ees ´etant fournies `a l’heure normale de l’Est (UTC-5). De

plus, les donn´ees indiquent la fin d’une p´eriode de mesure, mais puisque le premier champ utilise une heure 0, la premi`ere mesure pr´esent´ee pour une journ´ee repr´esente dans les faits la mesure entre 23:00:00 et 24:00:00 la journ´ee pr´ec´edente. Cette notation particuli`ere devra ˆ

etre prise en consid´eration lors de l’int´egration des donn´ees au syst`eme d’information. Les donn´ees ´etant fournies sous la forme de fichiers texte, la question de l’encodage des fichiers pourrait se r´ev´eler probl´ematique lors de traitements automatis´es. En effet, les fichiers fournis utilisent l’encodage US-ASCII, alors que la plupart des syst`emes modernes, langages de programmation et SGBDR utilisent l’encodage UTF-8. Il pourrait donc ˆetre n´ecessaire de sp´ecifier cet encodage lors de l’ouverture des fichiers, ou plus simplement de proc´eder `a une conversion avant leur utilisation afin d’´eviter des informations erron´ees sous la forme de caract`eres incorrects.

Malgr´e l’imposition d’une norme formelle d´ecrite dans les fichiers d’accompagnement, il s’av`ere que celle-ci est incompl`ete et peut mˆeme parfois induire des erreurs. Par exemple, bien que le nombre de caract`eres pouvant ˆetre contenu sur une ligne soit d´efini par la norme, il s’av`ere que certaines lignes ne respectent pas exactement ce crit`ere, ce qui peut mener `a des erreurs lors de traitements automatis´es. Par ailleurs, malgr´e la description d’un grand nombre de param`etres ainsi que des codes num´eriques associ´es, six param`etres sont fournis sans toutefois ˆetre document´es, soit les param`etres ayant les codes num´eriques 1148, 1196, 1151, 57854, 57855, 57856 et 57857. Si la plupart de ces param`etres ne poss`edent pas d’entr´ees autres que des espaces vides dans les fichiers, les param`etres 1196 et 1151 peuvent ˆetre associ´es manuellement aux valeurs de vent maximum, le nom du fichier offrant une indication `a cet effet, alors que des versions imprimables en fichier PDF permettent de conclure que le param`etre 1196 repr´esente les valeurs de vitesse du vent et le param`etre 1151 la direction en degr´es.

Une autre probl´ematique n’engendrant toutefois pas de probl`emes importants de gestion de donn´ees se pr´esente sous la forme de plusieurs param`etres pour lesquels aucune valeur de mesure n’est fournie. Ces param`etres sont 1148, 11903, 1151, 57854, 57855, 57856 et 57857. En l’absence d’informations suppl´ementaires, il est impossible d’expliquer les raisons pour lesquelles ces param`etres sont fournis sans aucune mesure associ´ee.

Finalement, une autre probl´ematique qui ne pose pas de probl`emes de gestion `a ce point se pr´esente sous la forme de plusieurs param`etres mesurant des donn´ees semblables fournies dans les mˆemes fichiers. Par exemple, le fichier contenant les vitesses instantan´ees du vent pr´esente les param`etres 1148, 1193, 1566 et 1192. Si les deux premiers param`etres ne comportent pas de mesures dans cet ensemble particulier, la possibilit´e d’avoir deux mesures pour la mˆeme information engendre des risques potentiels de cr´eation de doublons. Par cons´equent, les param`etres ne poss´edant pas de mesures formelles devraient ˆetre ignor´es lors du traitement

afin d’´eviter le stockage d’informations discordantes et tout traitement automatis´e devrait ˆ

etre fait en anticipant ce probl`eme ´eventuel.

Tableau 3.7: Codes num´eriques et d´efinitions des donn´ees m´et´eo

code4 param`etre unit´e

1076 , 1077, 1699 Temp´erature maximale ◦C

1078 , 1079, 1700 Temp´erature minimale ◦C

1080 , 1081, 1702 Temp´erature instantan´ee ◦C

1082 , 1083, 1701 Temp´erature moyenne ◦C

1010, 1753, 1758,

1780, 1840, 2047 Pluie (pluviom`etre `a pes´ee) mm 1746, 2155 Pluie (pluviom`etre `a augets) mm 1011, 1754, 1759,

1781, 1842, 2057 Neige (pluviom`etre `a pes´ee) cm 1012, 1593, 1763,

1782, 1838, 2037

Pr´ecipitations totales (pluviom`etres `a

pes´ee) mm

1709 Pr´ecipitations totales (pluviom`etres `a

augets) mm

1007, 1764, 1777, 1779, 1837, 2036

Pr´ecipitations totales cumul´ees

(pluviom`etre `a pes´ee) mm 1708 Pr´ecipitations totales cumul´ees

(pluviom`etre `a augets) mm 51377 Pr´ecipitations totales cumul´ees

(pluviom`etres `a augets chauffant) mm

1148 , 1566 Vent - Direction ◦

1192 , 1193 Vent - Vitesse km/h

1344 , 1694 Humidit´e relative %

1568, 2152 Point de ros´ee calcul´e `a partir de l’humidit´e relative

C

1151 Vent maximum - Direction ◦

1196 Vent maximum - Vitesse km/h

4. Les param`etres obtenus et document´es sont surlign´es en vert, les param`etres document´es mais ne contenant que des entr´ees vides sont surlign´es en gris, les param`etres non document´es mais avec des donn´ees sont surlign´es en jaune, et les param`etres non document´es et pour lesquels uniquement des entr´ees vides sont obtenues sont surlign´es en rouge.