• Aucun résultat trouvé

PRESENTATION DES DONNEES DE L’ETUDE : DESCRIPTION, VALIDITE, ANALYSE

1. N ATURE DES DONNEES DE L ’ ETUDE

1.3. Fiabilité des données

1.3.1. Sources d’erreur sur la mesure du débit et élimination des secteurs non conformes

La mesure du débit de fuite, que nous souhaitons modéliser, est altérée par des erreurs ou des imprécisions. La cause principale de rejet de certains secteurs réside dans le fait qu’une majorité d’entre eux présentent au cours de la chronique des valeurs de débit négatives. Seuls 372 secteurs sur un total initial supérieur à 800 affichent sur la période considérée des débits exclusivement positifs.

De nombreux secteurs présentent également des mesures aberrantes et inexploitables. La Figure 5 en montre un exemple avec une chronique incluant de plus des valeurs manquantes, autre défaut de mesure fréquemment rencontré.

Secteur 62

0 0.2 0.4 0.6 0.8 1 1.2 1.4

09-avr-01 18-juil-01 26-oct-01 03-févr-02 14-mai-02 22-août-02 30-nov-02 10-mars-03 18-juin-03 26-sept-03 te mps (jj-mois-aa)

bit (m3.h-1.km-1)

débit nocturne mesuré estimation du débit de fuite estimation de la consommation

Figure 5. Principaux défauts des données de débit.

La succession de valeurs en dents de scie du milieu de chronique ne correspond certainement pas à un phénomène observé sur le secteur mais plus à un défaut de la mesure. En fin de chronique, la longue succession de valeurs mesurées constantes et la période d’absence de données qui suit constituent également des éléments conduisant au rejet d’une telle chronique dans l’optique d’une modélisation. Aucun processus physique ne peut expliquer son allure.

L’exploitation de telles chroniques est donc impossible. Nous pourrions cependant par des procédures statistiques (PROC EXPAND sous SAS par exemple) remplacer les valeurs aberrantes ou combler les manquantes par des valeurs calculées, mais nous avons préféré ne retenir que des chroniques plus fiables.

Plusieurs causes distinctes peuvent expliquer ces défaillances dans la qualité des données : - les compteurs ou débitmètres utilisés peuvent dériver avec le temps, ou bien encore la télétransmission associée peut cesser suite à des épisodes orageux par exemple.

Dans tous les cas, la donnée de débit s’en trouve altérée ;

- la formule de calcul du débit sur le secteur peut parfois être erronée, nous avons pu nous en rendre compte par nous-même sur des réseaux girondins. Les sens d’écoulement sur le réseau ne sont pas toujours maîtrisés ; la mesure ne représente alors plus le débit sur le secteur. Si la présence d’une valeur négative sur une chronique est due à cette méconnaissance du réseau, c’est toute la chronique qu’il faut supprimer ;

- la précision de la mesure ou de l’information conservée lors du transfert de données vers le poste de stockage s’avère dans certains cas handicapante. On remarque sur le Secteur 59 représenté sur la Figure 6, le nombre limité de valeurs que prend le débit mesuré, faute de précision des appareils de mesure (réglage ou capacité) ou d’une transmission de données altérée. Si nous souhaitons présenter un modèle prenant en compte une éventuelle croissance hebdomadaire continue du débit de fuite, un tel secteur ne peut nous être utile : son débit de fuite n’est pas rendu assez finement.

Secteur 59

0 0.5 1 1.5 2 2.5 3

09-avr-01 18-juil-01 26-oct-01 03-févr-02 14-mai-02 22-août-02 30-nov-02 10-mars-03 18-juin-03 26-sept-03 te mps (jj-mois-aa)

bit (m3.h-1.km-1)

débit nocturne mesuré estimation du débit de fuite estimation de la consommation

Figure 6. Précision défaillante de la mesure de débit.

L’incertitude concernant l’estimation de la consommation demeure, nous l’avons dit, mais sans moyen de la lever. Nous utiliserons donc la donnée telle quelle.

1.3.2. Incertitudes sur la bonne retranscription des données de réparations

L’observation de certaines chroniques nous amène légitimement à nous interroger sur la qualité des données relatives aux réparations fournies.

Nous présentons l’exemple du Secteur 1 sur la Figure 7. Il montre qu’une ou plusieurs casses ont été réparées immédiatement après le pic de débit apparaissant fin 2002 (chute facilement observable dans les valeurs du débit). Il n’en est cependant pas fait état dans les chroniques de réparations associées puisque aucune intervention n’est signalée dans cette période. Nous pensons que ce pic est bien dû à une casse, et pas à une valeur aberrante, puisque deux semaines après cet événement le débit croît à nouveau de façon régulière et cohérente à partir d’un niveau plus bas que celui qu’il présentait initialement. C’est donc que non seulement la casse responsable de la hausse soudaine a bien été réparée, mais que dans le même temps d’autres fuites adjacentes et probablement détectées par une opération de recherche ont elles aussi été réparées. Les traces de ces réparations devraient être visibles dans les chroniques correspondantes, mais il n’en est rien.

Une majorité de secteurs soulèvent de telles interrogations. Il n’est également pas toujours évident d’être parfaitement convaincu que la distinction entre fuite réparée sur détection visuelle ou sur recherche a été bien respectée.

Secteur 1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

20-mars-01 06-oct-01 24-avr-02 10-nov-02 29-mai-03 15-déc-03

te mps (jj-mois-aa)

Figure 7. Incertitude sur les données de réparations.

débiu (m3.h-1.km-1)

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

cumul des réparations (nb.km-1)

ite t de f

estimation du débit de fuite cumul des réparations sur détection visuelle cumul des réparations sur recherche

1.3.3. Approximations sur les données patrimoniales et d’exploitation

Pour conclure cette partie sur la fiabilité des données, évoquons brièvement la qualité des données patrimoniales et d’exploitation, elle aussi discutable. Un certain nombre d’interrogations subsistent les concernant.

Nous ne savons par exemple pas si les âges ou les diamètres moyens fournis font l’objet d’une procédure de calcul normalisée sur chaque secteur. Si les conduites de faible diamètre sont écartées, le sont-elles toutes au même niveau sur l’ensemble des secteurs ? De plus, les informations sur les vieilles conduites ne sont bien souvent que des suppositions qu’il est difficile de vérifier.

En outre, certaines données, comme la corrosivité ou l’indice de mouvement du sol, relèvent de l’appréciation du gestionnaire, en fonction de son expérience et de ce qu’il observe sur le terrain, et ne sont pas mesurées. Dès lors, on comprend aisément que deux environnements de conduites semblables pourront être qualifiés différemment dans deux services distincts.

Enfin, le concept de pression moyenne du secteur reste imprécis. Lorsque la valeur est disponible, nous ne savons pas de quel type de mesure elle est issue et lorsque aucune mesure n’a été effectuée, elle est systématiquement estimée à 50 mCE.

1.3.4. Avantage d’exploiter des chroniques longues

Les causes d’incertitude et d’erreur sur les données sont fort nombreuses et à tous niveaux. Il s’avère délicat, voire impossible, de trouver des secteurs sur lesquels n’émettre aucun doute.

Toutefois, le fait de disposer de données qui s’étendent sur 135 semaines pour chaque chronique nous prémunit du poids trop important que pourrait prendre une valeur aberrante.

Ainsi, quelques valeurs erronées sur une chronique ne remettent pas en cause la possibilité de la traiter dans une optique de modélisation par exemple. La longueur des chroniques, en même temps qu’elle augmente les risques de présenter certaines mesures visiblement fausses, permet de fondre partiellement ces points aberrants dans un ensemble plus cohérent.