• Aucun résultat trouvé

Évaluation du patrimoine des réseaux d'eau potable en 2017 aux échelles nationale et de bassin - France métropolitaine et DROM

N/A
N/A
Protected

Academic year: 2021

Partager "Évaluation du patrimoine des réseaux d'eau potable en 2017 aux échelles nationale et de bassin - France métropolitaine et DROM"

Copied!
115
0
0

Texte intégral

(1)

HAL Id: hal-02946978

https://hal.inrae.fr/hal-02946978

Submitted on 23 Sep 2020

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Public Domain

Évaluation du patrimoine des réseaux d’eau potable en

2017 aux échelles nationale et de bassin - France

métropolitaine et DROM

Alain Husson, Alice Vacelet, Yves Le Gat, Anne-Emmanuelle Stricker, Eddy

Renaud

To cite this version:

Alain Husson, Alice Vacelet, Yves Le Gat, Anne-Emmanuelle Stricker, Eddy Renaud. Évaluation du

patrimoine des réseaux d’eau potable en 2017 aux échelles nationale et de bassin - France

métropoli-taine et DROM : Approche technique. [Rapport Technique] INRAE. 2020. �hal-02946978�

(2)

Programme 2016/2018 – Action n° 70

Construction d’un dispositif

permanent d’évaluation du

patrimoine des réseaux d’eau

potable aux échelles nationale

et de bassin

Axe 1 : Approche technique

Rapport final

France métropolitaine et DROM

Alain HUSSON (Irstea)

Alice VACELET (Irstea)

Yves LEGAT (Irstea)

Anne-Emmanuelle STRICKER (Irstea)

Eddy RENAUD (Irstea)

Mai 2020

Document élaboré dans le cadre de la convention AFB –Irstea 2016-2018 En partenariat avec le Ministère de la Transition Ecologique et Solidaire

(3)

A

UTEURS

Alain HUSSON, Ingénieur (1), alain.husson@inrae.fr Alice VACELET, Ingénieure (1), alice.vacelet@inrae.fr Yves LEGAT, Ingénieur (1), yves.legat@inrae.fr

Anne-Emmanuelle STRICKER, Ingénieure (1), anne-e.stricker@inrae.fr Eddy RENAUD, Ingénieur (1), eddy.renaud@inrae.fr

(1) INRAE - ETBX

50 avenue de Verdun, Gazinet 33612 CESTAS Cedex

C

ORRESPONDANTS OFB :

Eric BREJOUX, Direction de la Connaissance et de l’Information sur l’Eau, eric.brejoux@ofb.gouv.fr INRAE : Eddy RENAUD, responsable de l’équipe GPIE, eddy.renaud@inrae.fr

MTES : Fanny GARD, GR1 DEB fanny.gard@developpement-durable.gouv.fr

Droits d’usage : accès libre Niveau géographique : national Couverture géographique : France

(4)

Remerciements

Les auteurs tiennent à remercier les responsables et les exploitants des services des eaux qui ont transmis les données patrimoniales de leurs réseaux et ainsi rendu possible ce travail. Ils remercient également les membres du comité de suivi de l’étude pour leur appui dans la collecte des données et pour leur contribution à la définition des orientations de cette étude :

- Patrick EISENBEIS, SMEGREG

- Philippe LOLMEDE, Charente-Eaux

- Emmanuel PICHON, AELB

- Lauriane BOULP AEAG

- Julie CORDIER, AERM

- Véronique LAHOUSSINE, AESN

- Karine VALLEE, AEAP

(5)

S

OMMAIRE

1.

Introduction ... 6

Contexte ... 6

1.1.

Cadre général de l’étude... 6

1.2.

Objectifs et contenu de l’étude ... 6

1.3.

Point sur les travaux antérieurs ... 7

1.4.

2.

Collecte et traitement des données ... 8

Echelles et utilisations des données ... 8

2.1.

Données SISPEA ... 9

2.2.

Données SIG...10

2.3.

Données communales ...10

2.4.

3.

Modélisation de la longueur de canalisations ... 12

Méthode et résultats antérieurs ...12

3.1.

Intégration des données complémentaires ...12

3.2.

Procédure de validation...12

3.3.

Modélisation des longueurs totales de réseau à l’échelle du service ...14

3.4.

Modélisation des longueurs totales de réseau à l’échelle de la commune ...15

3.5.

4.

Bilan et analyse des données SIG et BDD collectées ... 17

Taux de collecte des données...17

4.1.

Evaluation des inconnues ...18

4.2.

Description des données « matériau » ...20

4.3.

Description des données « diamètre » ...22

4.4.

Description des données « période de pose » ...24

4.5.

5.

Modélisation des longueurs par diamètre, période de pose et matériau ... 25

Méthode ...25

5.1.

Modélisation des diamètres ...28

5.2.

Modélisation des périodes de pose ...30

5.3.

Modélisation des matériaux ...32

5.4.

6.

Synthèse des résultats au niveau national (hors DROM) ... 36

Répartition par Agence de l’Eau ...37

6.1.

Répartition par diamètre ...38

6.2.

Répartition par période de pose ...39

6.3.

Répartition par matériau ...40

6.4.

7.

Synthèse des résultats des DROM ... 40

Département de la Guadeloupe ...41

7.1.

Département de la Martinique ...42

7.2.

Département de la Guyane ...42

7.3.

Département de la Réunion ...43

7.4.

Département de Mayotte...43

7.5.

8.

Conclusion ... 44

(6)

9.

Bibliographie ... 46

10.

Table des illustrations ... 48

11.

Annexe 1 : Traitement des SIG ... 50

Nettoyage des couches SIG ...50

11.1.

Création d’identifiant / métadonnées de chaque service ...50

11.2.

Règles de gestion des dates et périodes de pose ...50

11.3.

Gestion des matériaux ...51

11.4.

Pression nominale ...52

11.5.

Gestion des diamètres ...52

11.6.

Vue de la table attributaire constituée ...55

11.7.

12.

Annexe 2 : Carroyage 500mX500m - classe de bâti ... 57

13.

Annexe 3 : Hydroterritoire AQUADEP ... 58

14.

Annexe 4 : Route tampon 250 ... 59

15.

Annexe 5 : Base de données communale ... 61

16.

Annexe 6 : Paramètres des modèles « longueur totale » retenus ... 77

17.

Annexe 7 : Modèles Diamètre ... 78

18.

Annexe 8 : Modèles Période de pose ... 86

19.

Annexe 9 : Modèles Matériau avec FI et PVCI ... 94

20.

Annexe 10 : Modèles Matériau sans FI et PVCI ... 105

(7)

C

ONSTRUCTION D

UN DISPOSITIF PERMANENT D

EVALUATION DU PATRIMOINE DES RESEAUX D

EAU POTABLE AUX ECHELLES NATIONALE ET DE BASSIN

1. Introduction

Contexte

1.1.

La loi n°2010-788 du 12 juillet 2010 (Grenelle II) et le décret n° 2012-97 du 27 janvier 2012 imposent depuis 2014 aux services publics de l’eau d’établir chaque année un descriptif détaillé des réseaux. La notice du décret indique : « La loi invite les collectivités organisatrices des services d’eau et

d’assainissement à une gestion patrimoniale des réseaux, en vue notamment de limiter les pertes d’eau dans les réseaux de distribution. A cet effet, elle oblige à établir un descriptif détaillé des réseaux ». Le

décret en précise le contenu : « le descriptif doit inclure, d’une part, le plan des réseaux mentionnant la

localisation des dispositifs généraux de mesure, d’autre part, un inventaire des réseaux comprenant la mention des linéaires de canalisations, la catégorie de l’ouvrage, des informations cartographiques ainsi que les informations disponibles sur les matériaux utilisés et les diamètres des canalisations.».

Ce dispositif règlementaire signifie ainsi que la gestion patrimoniale des réseaux est un enjeu fort à l’échelle nationale (notamment pour limiter les pertes d’eau) et que la connaissance des réseaux est un préalable incontournable pour conduire une stratégie de gestion patrimoniale optimisée.

De même, aux échelles nationale ou de bassin, la définition et l’évaluation des politiques publiques à mener pour favoriser la gestion patrimoniale des réseaux nécessitent une connaissance aussi précise que possible du patrimoine.

Cadre général de l’étude

1.2.

La connaissance antérieure du patrimoine des réseaux de distribution d’eau potable à l’échelle nationale repose essentiellement sur trois sources :

• L’étude réalisée en 2002 par GEOPHEN sur la base des inventaires exhaustifs de 8 départements extrapolés à l’ensemble du territoire [Cador, 2002] ;

• Les enquêtes réalisées à l’échelle communale par l’Ifen puis SOeS portant sur les années 1998, 2001, 2004 et 2008 et basées sur un échantillon d’environ 5 200 communes [IFEN, 2001] ; • L’analyse de la base de données du Système d’Information des Services Publics d’Eau et

d’Assainissement (SISPEA) réalisée par l’ONEMA sur les données 2010 (extrapolation à partir des services renseignés (41% des services représentant 76% de la population) [ONEMA, 2014] . L’étude GEOPHEN propose une répartition par période de pose, par diamètre et par matériau, les études ultérieures considèrent uniquement la longueur des canalisations. Les approches statistiques développées dans chacune de ces sources se basent soit sur un échantillon non choisi (départements volontaires pour GEOPHEN, services renseignés pour SISPEA) soit sur un échantillon construit dans un autre objectif (échantillon de communes - et non de services d’eau – construit pour évaluer un prix moyen de l’eau pour Ifen/SOeS). Il en résulte que la connaissance du patrimoine issue de ces études est peu détaillée, a priori peu précise et irrégulière dans le temps.

L’obligation de réalisation d’un descriptif détaillé des réseaux par chacun des services français constitue une opportunité pour tenter d’améliorer la connaissance des réseaux de distribution d’eau potable aux échelles nationale et de bassin.

Objectifs et contenu de l’étude

1.3.

La finalité de l’étude faisant l’objet du présent rapport est de construire un dispositif permanent d’évaluation du patrimoine des réseaux d’eau potable aux échelles nationale et de bassin adapté aux besoins de l’Etat et des Agences de l’Eau pour orienter leurs politiques publiques liées à la gestion patrimoniale des réseaux d’eau potable. Compte tenu de la lourdeur et de la difficulté de constituer une base de données nationale exhaustive (cf. les taux de remplissage de la base de données SISPEA), une approche statistique a été privilégiée.

(8)

Afin d’adapter au mieux la connaissance du patrimoine (données, niveau de précision, mise à jour…) aux besoins des utilisateurs potentiels, une analyse préalable de ces besoins a été réalisée pour orienter les contours du dispositif proposé. Enfin, une approche économique et financière a été conduite pour évaluer les coûts de la gestion patrimoniale, appréhender les éventuelles disparités territoriales et envisager les enjeux à moyen et long termes.

En conséquence, l’action de recherche a été décomposée en trois axes interdépendants :

- Axe 1 - Construction à partir d’approches techniques et statistiques d’une méthode d’évaluation du patrimoine des réseaux d’eau potable permettant d’estimer les linéaires de canalisations par matériau, diamètre et période de pose aux échelles nationale et de bassin. Cet axe a été porté par l’équipe GPIE de l’UR ETBX d’Irstea Bordeaux.

- Axe 2 - Identification des besoins des Agences de l’Eau, du MTES et de l’AFB et validation de l’adéquation du dispositif construit. Ce travail est basé sur des entretiens avec les acteurs a été porté par l’UMR G-EAU de Montpellier.

- Axe 3 - Evaluation financière et économique du patrimoine basée sur des données locales ou nationales en mobilisant l’analyse financière et la construction de modèles économétriques. Ce travail a été conduit conjointement par l’UMR GESTE de Strasbourg et l’équipe GPIE de l’UR ETBX d’Irstea Bordeaux.

Le présent rapport présente les résultats de l’axe 1.

Point sur les travaux antérieurs

1.4.

La seule étude qui donne une estimation complète du patrimoine des réseaux d’eau potable a été établie en 2002 par GEOPHEN [Cador, 2002]. Les données collectées sur 8 départements (cf Figure 1), concernant le linéaire du réseau par âge, matériau et diamètre des canalisations ont été extrapolées à la France entière.

(9)

Ces travaux ont permis de donner un ordre de grandeur du linéaire national (850 000 km) et des caractéristiques des réseaux d’eau potable en France et de proposer des pistes pour évaluer le taux de renouvellement des canalisations. L’étude est construite à partir d’une taille d’échantillon restreinte (65 000 km, soit environ 7,6 % du réseau national) avec une représentation parcellaire sur le territoire français. Depuis 2009 une partie des collectivités distributrices d’eau potable alimentent la base SISPEA de l’observatoire national des services publics de l’eau et de l’assainissement [ http://www.services.eaufrance.fr] et renseignent la longueur de leur réseau, ouvrant ainsi la possibilité d’améliorer les estimations nationales.

Les travaux réalisés en 2016 dans le cadre de la présente étude ont permis de caler un modèle statistique pour évaluer les linéaires des réseaux d’eau potable à l’échelle nationale [Han Muy, 2016 – Husson et al, 2016]. Ceci constituait une première étape de la connaissance des réseaux. Les données de la base SISPEA utilisées pour le calage du modèle linéaire de réseau ne permettent pas la caractérisation des canalisations ; c’est pourquoi la constitution d’une base de données construite à partir du recueil de données issues de Systèmes d’Information Géographiques (SIG) sur la France métropolitaine a été entreprise et a donné lieu à une première analyse des données collectées [Grondin, 2017 – Husson et al, 2017 - Husson et al, 2018].

Le présent rapport final est consacré à la modélisation des longueurs des réseaux globalement et par matériau, diamètre et période de pose. Il détaille dans un premier temps les bases de données utilisées ou créées ; puis décrit comment la combinaison des données SISPEA avec la nouvelle base de données SIG a permis l’amélioration du modèle d’évaluation du linéaire total des réseaux d’eau. Les données SIG collectées sont ensuite détaillées, puis utilisées pour modéliser les longueurs par diamètre, période de pose et matériau. Les prédictions des modèles sont ensuite comparées à l’échantillon collecté aux échelles nationale et de bassin.

2. Collecte et traitement des données

Echelles et utilisations des données

2.1.

Le principe central de la modélisation statistique mise en œuvre est de relier les données patrimoniales des réseaux d’’eau (longueurs, diamètres, périodes de pose et matériaux des réseaux) connues de façon partielle à des caractéristiques explicatives (géographiques, démographiques, administratives…) connues de façon exhaustive et de rendre ainsi possible une estimation des données patrimoniales là où elles ne sont pas connues.

Une problématique essentielle de cette méthode est l’échelle spatiale à laquelle sont disponibles les données. Les caractéristiques explicatives sont disponibles à l’échelle de la commune tandis que les données patrimoniales le sont à l’échelle du service d’eau potable (cf. Figure 2).

(10)

Figure 2 : Principe de la modélisation mise en œuvre

La base SISPEA inclut les liens d’appartenance des communes aux services des eaux, une commune pouvant être adhérente à plusieurs services. Cependant, à l’inverse des limites communales, la délimitation des services n’est pas géoréférencée. Ainsi, lorsqu’une commune relève de plusieurs services, il n’est pas possible avec les seules données SISPEA de répartir le territoire et le patrimoine de cette commune entre les différents services concernés. Lorsque le SIG est disponible, l’identification du réseau d’eau potable à l’échelle communale est possible.

Pour tenir compte de ces contraintes :

• Les modèles de la longueur totale d’un réseau ont été calés à la fois à l’échelle des services et à l’échelle communale

• Les modèles des longueurs par caractéristiques ont été calés à l’échelle communale • Les estimations ont été réalisées à l’échelle communale

• Les résultats sont produits aux échelles nationale et de bassin par concaténation des estimations à l’échelle communale

Dans la suite du présent rapport, les règles de construction et les effectifs des échantillons de calage sont précisés pour chacun des modèles présentés.

Données SISPEA

2.2.

Chaque année depuis 2009, certains services d’eau potable alimentent la base de données SISPEA. Une partie d’entre eux fournit la longueur totale du réseau d’eau potable hors branchements particuliers. D’une année à l’autre, les services qui renseignent de façon significative la base SISPEA ne sont pas les mêmes. Pour maximiser l’échantillon, toutes les données disponibles de 2009 à 2015 ont été exploitées. Pour qu’un service puisse servir au calage des modèles, il faut être capable d’associer la longueur de son réseau à des données disponibles à l’échelle communale. Quand une commune est desservie par plusieurs services, la base SISPEA ne fournit pas d’information sur la proportion du territoire concernée par chacun des services. En conséquence, seuls les services dont le linéaire de canalisation d’eau potable est connu et constitués de communes complètement desservies (communes « mono-services »), sont retenus pour constituer la base de calage. Tout service dont au moins une des communes est desservie par plusieurs services est écarté.

Au total, 6192 services sont retenus qui totalisent plus de 403 000 km de canalisations.

Modèles statistiques

Estimation, aux échelles nationale et de bassin, des

longueurs par diamètres, périodes de pose et matériaux

Variables explicatives disponibles de façon

exhaustive à l’échelle communale

Caractéristiques du

réseau disponibles sur

un échantillon de

données

(SISPEA – SIG)

(11)

Données SIG

2.3.

En complément de la base SISPEA, des collectivités ont été sollicitées pour la fourniture des données caractéristiques de leurs réseaux d’eau potable. Le périmètre considéré est limité au territoire national à l’exclusion des Territoires d'Outre-Mer.

Pour réaliser la collecte des données, les services d’eau potable dont le territoire inclut plus de 30 communes ou dont le réseau comporte plus de 500 km de canalisations ont été ciblés en priorité à partir de la base de données SISPEA. D’autres services ont ensuite été sollicité en concertation avec les membres du comité de suivi.

Le format SIG a été préféré pour permettre de croiser spatialement les données des bases géographiques nationales avec les réseaux géo-référencés. Quand le format SIG n’était pas disponible, les inventaires patrimoniaux ont néanmoins été collectés.

Les données recueillies auprès des services sont les variables que l’on va chercher à expliquer :

Données réseaux − Linéaire − Date de pose − Période de pose − Diamètre − Matériau

La diversité et l’hétérogénéité des données SIG fournies par les collectivités ne permettent pas une exploitation sous leur forme brute.

Chaque fichier de données recueilli a dû être traité individuellement selon un protocole mis au point pour aboutir à une représentation standardisée des données. Après analyse d’un échantillon de fichiers de données brutes pour recenser les formats et les incohérences les plus courants, une approche a été traduite dans un script codé pour décliner des opérations systématiques de nettoyage sur les différentes bases de données brutes de façon rapide et fiable. Au-delà de ces traitements systématiques, chaque fichier recueilli a fait l’objet d’un traitement individualisé adapté à son contenu, pour extraire les données pertinentes et les convertir sous une forme compatible avec le standard préalablement défini et pour pouvoir, in fine, les intégrer dans la base de données et les couches SIG du projet.

La procédure complète est détaillée en annexe 1 (chapitre 11).

Données communales

2.4.

Les variables composant les modèles statistiques qui prédiront les caractéristiques des réseaux d’eau potable en termes de matériaux, diamètres et date de pose doivent être des variables disponibles sur tout le territoire à la maille communale. Dans le but de déterminer les combinaisons de variables les plus pertinentes pour expliquer les caractéristiques des réseaux, une base de données dite « base communale » a été élaborée. Les principales bases de données sollicitées dans la recherche de variables sont les suivantes :

Open steet map

− Réseaux routiers

Corine Land Cover

− Occupation des sols

INSEE

− Population / densité de population − Surface communale

− Type de logements

− Données géographiques et administratives

IGN

(12)

− Altitude

D’autres variables ont été construites pour mieux caractériser les données communales : - Longueur de réseau estimée en km (cf chapitre 3)

- Densité de population en habitant par km²

- Densité de bâti = surface bâti / surface communale

- Nombre d’habitant par m² bâti = population communale / surface bâti - Surface urbaine / surface communale

- Nombre d’habitant par km de réseau = population communale / linéaire de réseau modélisé

- Les classes de densité de bâti, basées sur le croisement des couches SIG de bâti et l’occupation des sols

- Les classes de densité de bâti, basées sur le croisement des couches SIG de bâti et le carroyage de la France à la maille de 500 m de côté (Annexe 2 Chapitre 12)

- Le type d’hydroterritoire défini dans le cadre du projet Aquadep [Aquadep, 2012] (Annexe 3 Chapitre 13)

- Les longueurs de route desservant des habitations « Route tampon 250 » (Annexe 4 Chapitre 14)

L’ensemble des données retenues est décrit en annexe 5 (Chapitre 15). Les données y sont regroupées par thème.

(13)

3. Modélisation de la longueur de canalisations

Méthode et résultats antérieurs

3.1.

Chaque année depuis 2009, les services de distribution d’eau potable renseignent la base de données SISPEA qui contient de façon exhaustive l’information concernant les communes adhérentes et desservies d’un service, et qui inclus le linéaire du réseau d’eau potable pour une partie de ces services (entre 30 et 45 % suivant les années). La première estimation du linéaire national de réseau d’eau potable réalisée en 2016 [Husson et Al, 2016] à l’échelle du service s’appuyait sur les données collectées de 2009 à 2013, ce qui représentait 5056 services (13431 communes) et 350 000 km de réseau.

Un modèle multilinéaire a été utilisé pour étudier la relation entre la variable à expliquer Y (ici le linéaire du réseau AEP) et n variables explicatives X=(X1,…Xn), selon l’équation :

Les différents modèles ont été testés avec le logiciel R, spécialisé dans le calcul et l’analyse statistique.

Le modèle construit en 2016 par Han Muy [Han Muy, 2016] a permis d’estimer le linéaire de réseau national à environ 895 000 km :

é ∗ é ! "#

é ! "# est le linéaire routier traité en prenant en compte le bâti (voir annexe 4 Chapitre 14), et un coefficient dépendant de l’Agence de l’eau et de la classe de densité de population parmi les 3 classes (< 120 hab/km², 120-400 hab/km², > 400 hab/km²)

Intégration des données complémentaires

3.2.

Aujourd’hui, l’exploitation de la base de données SISPEA sur deux années supplémentaires (de 2009 à 2015 avec 6 148 services et 15 888 communes totalisant 391 562 km de canalisations) et la collecte de données SIG (8 876 communes supplémentaires, soit un complément de 265 490 km) ont permis de consolider l’échantillon de base contenant alors plus de 24 700 communes et 657 000 km de canalisation.

Cette nouvelle base de données plus complète a été utilisée pour construire de nouveaux modèles, d’abord comme antérieurement à l’échelle du service puis à l’échelle communale, échelle qui a été retenue pour la suite des travaux.

La sélection des modèles les plus performants a été effectuée grâce à une procédure de validation décrite ci-après.

Procédure de validation

3.3.

Pour vérifier la robustesse d’un modèle, on réalise une validation croisée qui mobilise la méthode de Monte-Carlo.

Une succession de tirages aléatoires est effectuée parmi la base initiale. Pour chaque tirage, on partage la base en deux échantillons, l’un dit d’« apprentissage » et l’autre de « test ». Le modèle est calé sur l’échantillon d’ «apprentissage » et appliqué sur l’échantillon « test ». Sur cet échantillon « test », on évalue l’écart relatif entre le linéaire constaté et le linéaire estimé pour chaque bassin pour juger de la pertinence du modèle. Les opérations se déroulent en quatre étapes (Figure 3) :

(14)

- 1ère étape : un tirage aléatoire est effectué pour partager la base de données disponible en deux, l’échantillon d’ «apprentissage » qui comporte 75% des individus de chaque agence de l’eau et l’échantillon de « test » qui est constitué des 25% d’individus restant ;

- 2ème étape : Le modèle est calé sur l’échantillon d’ « apprentissage » puis appliqué sur l’échantillon « test » ;

- 3ème étape : et on calcul, pour chaque agence de l’eau et au niveau national, l’écart relatif entre longueurs totales de réseau constatées et prédites par le modèle ;

- 4ème étape : Les étapes 1 à 3 sont répétées 2 000 fois. Les résultats ainsi obtenus permettent de représenter la distribution de l’écart relatif entre longueurs totales de réseau constatées et prédites par le modèle sous la forme d’une « boîte à moustache ». Le modèle est d’autant meilleur que la boîte est de taille réduite et centrée au voisinage de 0.

Figure 3 : Schématisation de la procédure de validation des modèles

Les résultats obtenus avec un modèle essentiellement basé sur la variable Routestraitéestampon250 sont

synthétisés en Figure 4 par des boîtes à moustaches groupant chacune les 2000 résultats de chaque Agence (AEAG Agence de l’Eau Adour-Garonne, AEAP Artois-Picardie, AELB Loire-Bretagne, AERM Rhin-Meuse, AERMC Rhône-Méditerranée-Corse, AESN Seine-Normandie) et pour la France entière. Si au niveau national les résultats sont plutôt satisfaisants, on constate des décalages importants pour certaines agences (AERM surestimation, AEAP sous-estimation du modèle).

1

2

3

4

Base

Services

SISPEA

+

Communes

SIG

Echantillon

d’« apprentissage »

Echantillon

de « test »

(15)

Figure 4 : Longueur totale, modèle route 250 : Validation croisée par AE – Lecture d’une boite à moustache

Modélisation des longueurs totales de réseau à l’échelle du service

3.4.

Le modèle a été complété par une série de variables prenant en compte la surface et la population communale, la répartition des routes dans les classes Corine land cover (CLC), le bâti et notamment sa répartition en zones ‘artificialisée hors zone habitée’ et ‘agricole’, et la répartition de la surface communale par classe de bâti :

é ∗ é ! "# "∗ $ % & & '' ( )∗ $ % & * +∗ $ % & ,â #∗ . '* / ,â #0 ∗ &( 1 / 1 2

∗ . '* / ,â 3 4 5 é ∗ . '* / ,â 6 4!5 07∗ 8 & '' ( &( / ,â 9 :9 :1,2,3,5@@

où les sont des coefficients dépendants de l’Agence de l’eau

Les modifications apportées permettent d’avoir un modèle dont les estimations sont plus équilibrées pour chaque agence, assurant une meilleure stabilité des prévisions (cf. Figure 5).

Quantile 75%

Quantile 25%

50 % des valeurs sont présentes dans cet intervalle Médiane

Moyenne

Valeurs extrêmes

(16)

Figure 5 : Longueur totale, modèle amélioré : Linéaire prédit en fonction du linéaire constaté - Validation croisée par AE

On obtient par application du modèle un linéaire national (hors DROM) de l’ordre de 877 000 km.

Modélisation des longueurs totales de réseau à l’échelle de la commune

3.5.

Les modélisations des longueurs par diamètre, matériau et période de pose qui sont présentées dans les chapitres suivants sont réalisées à la maille communale et utilisent la donnée « longueur total du réseau de la commune ». Il est donc pertinent, par souci de cohérence, de caler un modèle des longueurs totale en se basant sur l’échantillon de données disponibles à cette même échelle. Pour constituer cet échantillon, sont uniquement retenues dans SISPEA les services mono-commune :4 526 services et 128 787 km. Complétés par les données SIG (12 926 communes et 381 160 km), on obtient un échantillon de calage de 17 452 communes et 509 947 km.

Un modèle en tout point similaire à celui présenté au paragraphe 3.4 est calé sans impacts notoires sur la stabilité des estimations (cf

Figure 6

). Les paramètres du modèle sont détaillés en annexe 6 (Chapitre 16).

Figure 6 : Longueur totale, modèle amélioré : Linéaire prédit en fonction du linéaire constaté - Validation croisée par AE – calage sur échantillon communal

Ce sont les résultats obtenus grâce à ce modèle qui sont retenus et qui servent de base à la suite de l’étude.

L’estimation finale retenue à l’échelle nationale hors Dom-Rom est de l’ordre de 875 000 km. La répartition par Agence de l’Eau est détaillée dans le Tableau 1. Il est important de noter que l’intervalle de confiance à 95 % présenté ne prend en compte que les incertitudes liées au modèle mais non celles liées aux données collectées pour le calage du modèle provenant des erreurs d’alimentation de la base SISPEA ou des SIG (canalisations abandonnées non-supprimées, réseau incomplet, …)

Tableau 1 : Détail des linéaires de canalisation estimé par Agence

AGENCE Longueur en km borne inférieure intervalle de confiance à 95% borne supérieure intervalle de confiance à 95% AEAG 195 236 194 495 195 976

(17)

AEAP 39 512 38 986 40 037 AELB 288 679 287 858 289 499 AERM 38 308 37 702 38 914 AERMC 170 922 169 984 171 859 AESN 142 307 141 186 143 429 France 874 963 872 963 876 964

Il est à noter que l’estimation obtenue au paragraphe précèdent (environ 877 000 km) est incluse dans l’intervalle de confiance.

(18)

4. Bilan et analyse des données SIG et BDD collectées

Taux de collecte des données

4.1.

Les taux de collecte sont évalués sur la base des longueurs modélisées présentées dans le

Tableau 1

.

Echelle nationale :

Sur les 875 000 km de canalisations, 412 000 km ont été collectés au format SIG et 14 500 km sous forme d’inventaire. Cela représente 47 % du réseau national et quelques 440 SIG.

Echelle de bassin :

A l’échelle des bassins, les données collectées représentent entre 31 % et 57 % du linéaire total estimé (cf. Tableau 2 et Figure 7).

Tableau 2 : Evaluation du linéaire de réseau collecté par agence de l’eau

AGENCE Longueur estimée

km Part Agence /France en % Longueur collectée km Part Agence / échantillon collectée en % Taux de collecte en % AEAG 195 236 22,3 113 211 27,5 58 AELB 288 679 33,0 155 494 37,7 54 AESN 142 307 16,3 44 078 10,7 31 AEAP 39 512 4,5 21 433 5,2 54 AERM 38 308 4,4 12 840 3,1 34 AERMC 170 922 19,5 65 118 15,8 38 France entière 874 963 412 176 47

Figure 7 : Taux de collecte estimé du linéaire de canalisations par bassin hydrographique

(19)

La part des données collectées par agence comparée à la part du linéaire de canalisations de chaque agence dans le réseau national est un peu déséquilibrée (méthode du test d’ajustement multinomial), avec une surreprésentation d’Adour Garonne et Loire Bretagne (cf. Figure 8), et à contrario, une sous-représentation de Seine Normandie et Rhône Méditerranée Corse. Ce biais sera corrigé dans les modèles par des variables géographiques.

Il faut donc être conscient que dans les tableaux et figures présentés dans la suite de ce chapitre, les données collectées de la France entière sont fortement influencées par les deux agences Loire Bretagne et Adour Garonne qui représentent à elles seules 55 % du linéaire total et 65 % du linéaire collecté.Ce constat, qui traduit les écarts entre les taux de collecte obtenus sur les différents bassins hydrographiques, incite à faire preuve d’une grande prudence dans l’interprétation des analyses effectuées à l’échelle nationale sur la base des seules données de notre échantillon avant traitement ou modélisation.

Figure 8 : Répartition par agence de l’eau des longueurs de réseau totales estimées et collectées

Evaluation des inconnues

4.2.

La part des données inconnues est très variable suivant les attributs et suivant la localisation géographique (cf. Tableau 3) :

- La connaissance des matériaux et des diamètres est plutôt bonne, les inconnus restent inférieurs à 10 % avec une moyenne autour de 5%. Les diamètres sont mieux connus que les matériaux :

 Matériau : Moyenne 6,2% - minimum 2 % - maximum 8,9%

 Diamètre : Moyenne 4,0% - minimum 1,6 % - maximum 6,8 %

- Pour les dates et périodes de pose, les valeurs inconnues sont importantes et plutôt de l’ordre de 30%, même si les périodes de pose sont un peu mieux renseignées par construction (s’il y a une date de pose, la période est automatiquement renseignée) :

 Date de pose : Moyenne 35 % - minimum 20 % - maximum 46%

 Période de pose : Moyenne 31 % - minimum 16 % - maximum 40 % 22,3% 33,0% 16,3% 4,5% 4,4% 19,5%

Répartition du linéaire AEP estimé par Agence

AEAG AELB AESN AEAP AERM AERMC 27,5% 37,7% 10,7% 5,2% 3,1% 15,8%

(20)

Tableau 3 : Part du linéaire total inconnu dans l’échantillon collecté en pourcentage

Matériau Diamètre Date de pose Période de

pose ICGP45 AEAG 7,5 6,8 46 40 39 AELB 4,7 2,3 29 26 42 AESN 8,9 2,5 31 27 41 AEAP 2,0 1,6 24 17 43 AERM 2,4 2,3 20 16 43 AERMC 7,6 5,7 41 35 40 Moyenne 6,2 4,0 35 31 40

La variable date de pose est globalement mal, voire très mal, renseignée.

Les périodes de pose sont par construction mieux renseignées que les dates de pose, puisque lors du prétraitement des données, à une date est associée une période de pose. La part d’inconnues reste cependant élevée (cf. Figure 9).

Figure 9 : Part de dates et périodes de pose inconnues par agence de l’eau

Cette part d’inconnues très importante rend la modélisation des données « date et période de pose » délicate avec potentiellement des biais importants:

- Un meilleur remplissage des dates récentes (au-delà des années 1990);

- Une meilleure qualité des données récentes (plus la pose est récente, meilleure est l’information) ; - A contrario, un doute sur la qualité des données anciennes.

Dans le cadre du dispositif Grenelle, l’Indice de Connaissance et de Gestion Patrimoniale des réseaux d’eau potable (ICGP), indicateur réglementaire du Rapport annuel sur le Prix et la Qualité du Service (RPQS), a été modifié par l’arrêté du 2 décembre 2013 pour permettre de mesurer la conformité du service à son obligation de produire le descriptif détaillé des ouvrages de transport et de distribution d’eau potable. Un score minimum de 40 points sur 120 doit être obtenu pour satisfaire cette obligation. En pratique, au sein du texte définissant cet indicateur, cela concerne sept alinéas totalisant 45 points.

Si l’on considère que, du fait de l’existence d’un SIG, les 15 points relatifs au plan du réseau sont acquis, les niveaux de connaissance en diamètre, matériau et période de pose constatés permettent d’évaluer pour chaque bassin hydrographique et à l’échelle nationale la valeur d’ICGP45, score obtenu sur les 45 premiers points de l’ICGP (Tableau 3). Les scores s’étendent de 39 (Adour-Garonne) à 43 (Artois-Picardie et Rhin-Meuse) avec une valeur à l’échelle nationale de 40. Ces scores moyens qui, rappelons-le, concernent un échantillon constitué de services dotés d’un SIG (donc qui exclut les services dont la connaissance du réseau est la plus lacunaire), laissent supposer qu’un nombre important de services ne disposent pas actuellement d’un descriptif détaillé des ouvrages de transport et de distribution d’eau

0% 10% 20% 30% 40% 50%

AEAG AELB AESN AEAP AERM AERMC France

Pa rt d u l in é a ir e t o ta l p o s é Agence Date inconnue Periode inconnue

(21)

potable au sens de la réglementation. Ce constat ne concorde pas avec les tendances déduites des déclarations des services auprès des Agences de l’Eau ou de l’Observatoire des Services Publics de l’Eau et de l’Assainissement [AFB, 2017], selon lesquelles environ 80 % des services ont un score d’ICGP supérieur à 40.

Description des données « matériau »

4.3.

Sur les seize types de matériau initialement distingués hors inconnus (cf. annexe 1, paragraphe 11.4), certains sont très peu représentés dans chacun des bassins. Ainsi, aucune des sept modalités suivantes ne dépasse, en proportion, 1 % du linéaire total de l’échantillon collecté : Fonte Centriflex (FC) ; Polychlorure de vinyle bi-orienté (PVCB) ; Polyéthylène indifférencié (PEI) ; Polyéthylène basse densité (PEB) ; Béton indifférencié (BI) ; Béton âme tôle (BAT) et Autres matériaux (Autre) (cf. Figure 10).

Figure 10 : Répartition du linéaire par type de matériau dans l’ensemble de l’échantillon collecté

Ces sept modalités ainsi que les canalisations en PEH sont regroupées pour assurer un meilleur calage des modèles. On introduit ainsi trois modalités modifiées :

- Divers = BAT + BI + PEB + PEH + PEI + Autre ; - PVCR = PVCR + PVCB ;

- FI = FC + FI.

La répartition des matériaux fait ressortir des différences marquées entre le grand sud-ouest où les canalisations en PVC sont majoritaires et le reste de la France où la fonte est utilisée de façon prépondérante (Tableau 4 et Figure 11) :

0% 5% 10% 15% 20% P a rt d u l in é a ir e t o ta l France

(22)

Tableau 4 : Répartition des matériaux par agence de l’eau FI FG FD Total Fonte PVCI PVCV PVCR Total PVC A AC Divers Matériau Inconnu AEAG 9,6 8,3 8,8 26,7 21,1 23,9 11,7 56,7 3,4 2,9 2,9 7,5 AELB 5,3 6,0 10,9 22,2 15,3 26,8 21,8 63,9 2,2 3,3 3,6 4,7 AESN 8,4 21,2 22,4 52,0 7,8 13,0 4,1 24,9 3,2 3,5 7,5 8,9 AEAP 6,2 18,5 28,4 53,1 2,7 3,1 4,9 10,7 5,1 21,2 7,7 2,0 AERM 7,9 28,8 36,8 73,5 1,9 7,7 9,5 19,1 2,3 0,4 2,2 2,4 AERMC 13,0 14,1 35,2 62,3 7,5 6,1 4,7 18,3 2,9 2,6 6,2 7,6 Moyenne 8,2 10,9 17,1 36,2 13,8 19,4 13,2 46.4 2,9 3,9 4,4 6,2

Figure 11 : Répartition cumulée des linéaires par matériaux dans l’échantillon collecté

Dans les représentations suivantes, on s’intéresse à la proportion de chaque matériau hors inconnu

8 A é B A é /: B ( − ( B A é & @

La Figure 12 fait apparaître clairement le contraste « PVC – fonte » entre le grand sud-ouest et le reste de la France. La desserte en eau potable de l’habitat rural très dispersé du grand sud-ouest a été réalisée des années 60 à la fin des années 80, et les canalisations en PVC ont alors largement été utilisées. La proportion de PVC posée avant les années 80 y est en conséquence relativement importante : 24 % en AEAG, 27% en AELB, contre moins de 13% sur les autres agences (cf. Figure 13).

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

AEAG AELB AESN AEAP AERM AERMC France

P a rt d u l in é a ir e t ot a l p os é Agence Matériau inconnu Divers A FD FI FG AC PVCR PVCI PVCV

(23)

L’amiante ciment se retrouve partout en France, mais dans des proportions faibles (moins de 4%) excepté sur le territoire de l’AEAP (21%) et en particulier dans le département du Nord où elle représente plus de 30 % du linéaire total (cf. Figure 13).

Part de la fonte

Part du PVC

Figure 12 : Part des canalisations en Fonte et en PVC au sein des agences de l’eau

Part du PVCV Part de l’amiante ciment

Figure 13 : Part des canalisations en PVC d’avant 1980 et en amiante ciment au sein des agences de l’eau

Description des données « diamètre »

4.4.

Les diamètres initialement répartis en 18 modalités (cf annexe 1 paragraphe 11.6) sont regroupés en 6 modalités pour augmenter les effectifs de chaque classe et ainsi faciliter le calage des modèles.

En effet, le diamètre des canalisations du réseau national est concentré sur les diamètres inférieurs à 300 mm. Au-delà, les longueurs de canalisations par diamètre sont faibles, elles représentent moins de 3% du total et sont inférieures à 1% pour chacune des 7 modalités de 350 à 701 mm (Figure 14) :

- E 50mm : regroupement des 3 classes de diamètres E à 50 ; - 60-80 mm : regroupement de 2 classes ;

- 100 mm inchangé ;

- 125-150 mm : regroupement de 2 classes ; - 200-250 mm : regroupement de 2 classes ;

(24)

- ≥ 300 mm : regroupement de 8 classes.

Figure 14 : Répartition des diamètres dans l’ensemble de l’échantillon collecté

On note une prépondérance des diamètres inférieurs à 80 mm pour l’AEAG et l’AELB. A l’inverse, pour les autres agences, les diamètres supérieurs ou égaux à 100 mm sont majoritaires, avec des diamètres privilégiés de 100 mm et 150 mm (cf. Tableau 5 et Figure 15).

La présence du diamètre 100 mm est prépondérante sur l’AESN, l’AEAP, l’AERM et l’AERMC, mais représente moins de 20 % sur l’AEAG et l’AELB. Les petits diamètres sont très présents dans les zones rurales du grand sud-ouest caractérisées par un habitat très dispersé.

Le bassin Rhin-Meuse se distingue par une proportion importante de gros diamètres puisque plus de 75 % des conduites ont un diamètre au moins égal à 100 mm.

Tableau 5 : Répartition des diamètres par agence de l’eau en pourcentage

<= 50 mm 60-80 mm 100 mm 125 – 150 mm 200 – 250 mm >= 300 mm Dia Inconnu AEAG 38,6 20,5 14,8 12,2 5,0 2,2 6,8 AELB 29,0 22,2 18,4 17,4 6,7 4,0 2,3 AESN 15,7 20,9 25,2 19,1 8,9 7,6 2,5 AEAP 10,4 22,7 30,2 17,4 9,9 7,7 1,6 AERM 5,7 15,7 30,2 26,3 11,9 8,0 2,3 AERMC 12,9 19,8 24,7 21,0 9,3 6,6 5,7 Moyenne 26,0 21,0 20,1 17,0 7,2 4,6 4,0 0% 5% 10% 15% 20% 25% P a rt d u l in é a ir e t o ta l France

(25)

Figure 15 : Répartition cumulée des linéaires par diamètre dans l’échantillon collecté

Description des données « période de pose »

4.5.

L’analyse des périodes de pose est préférée à celle des dates de pose moins bien renseignées. L’interprétation se révèle délicate en raison de la part d’inconnues élevée (jusqu’à 40%) ce qui introduit vraisemblablement un biais dans la part relative de chacune des périodes (cf. Tableau 6).

Les périodes de pose des canalisations récentes (au-delà des années 1990) sont renseignées de façon plus systématique et donc bien mieux connues que celles des conduites anciennes. Les inconnues et les données douteuses concernent donc majoritairement les anciennes canalisations.

Tableau 6 : Répartition des périodes de pose par agence en pourcentage

< =45 46_65 66_70 71_80 81_90 >90 Période inconnue >1990/an AEAG 2 16 8 15 5 15 40 0,6 AELB 2 10 6 24 11 22 26 0,8 AESN 14 14 7 15 7 16 27 0,6 AEAP 7 21 10 14 8 23 17 0,9 AERM 12 16 5 13 10 29 16 1,1 AERMC 4 12 7 11 9 23 35 0,9 Moyenne 4 13 7 17 8 20 31 0,8 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

AEAG AELB AESN AEAP AERM AERMC France

P

a

rt

d

u

l

in

é

a

ir

e

t

o

ta

l

p

o

Agence Diamètre inconnu >=300mm 200-250mm 125-150mm 100mm 60-80mm <=50mm

(26)

Pour prendre en compte ce biais probable, la Figure 16 propose une représentation des longueurs cumulées de réseau par périodes de pose dans l’ordre chronologique inversé, des plus récentes vers les plus anciennes.

On note que si l’on exclut le bassin Adour-Garonne pour lequel le taux d’inconnues est très important, les canalisations posées après 1970 représentent toujours plus de 38 % de linéaire de réseau en service. Pour les bassins Rhin-Meuse et Loire-Bretagne, cette proportion dépasse 50 %.

Compte tenu de l’historique de pose des réseaux français, l’essentiel de la première desserte en eau des territoires était achevée à la fin des années 80 (taux de desserte de 98,2% en 1989 [OIEau, 2002]). Ainsi les réseaux posés après 1990 concernent, pour une faible part des extensions de réseau, des renforcements et pour une part importante, des travaux de renouvellement. Sur cette base, il peut être considéré que la part moyenne annuelle des canalisations posées après 1990 (colonne « >1990/an » du

Tableau 6) donne une indication par excès sur la part de réseau renouvelée. Pour les trois bassins

Loire-Bretagne, Artois-Picardie et Rhône-Méditerranée-Corse, on constate une valeur intermédiaire de 0,8% à 0,9% par an, tandis qu’un taux plus faible de 0,6% par an est enregistré sur les bassins Adour-Garonne et Seine-Normandie. Pour le Bassin Rhin-Meuse, un taux de 1,1% par an semble indiquer un effort de renouvellement plus intense.

Figure 16 : Répartition cumulée des linéaires par période de pose dans l’échantillon colecté

5. Modélisation des longueurs par diamètre, période de pose et matériau

Méthode

5.1.

A partir de l’échantillon des données collectées (SIG et inventaires), un travail statistique est à mettre en œuvre pour estimer aux échelles nationale et de bassin, les longueurs de réseau par diamètres, matériaux et périodes de pose. Or ces caractéristiques ne sont pas indépendantes. Les matériaux des canalisations ont évolué dans le temps en fonction des progrès technologiques (les PVC ne sont apparus que dans les années 1960, les PEBD dans les années 70 …). Les périodes de pose sont donc à la fois

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

AEAG

AELB

AESN

AEAP

AERM AERMC France

P

a

rt

d

u

l

in

é

a

ir

e

t

o

ta

l

p

o

Agence Période inconnue < =45 46_65 66_70 71_80 81_90 >90

(27)

une variable à expliquer, mais également potentiellement une variable explicative des matériaux [ONEMA, 2012].

De même, les matériaux dépendent des diamètres (par exemple : absence de PVC sur les gros diamètres).

La démarche employée prend en compte cette dépendance des variables : dans un premier temps, les diamètres sont modélisés, puis les périodes de pose qui peuvent s’appuyer sur les résultats précédents, et enfin les matériaux.

Modèle Dirichlet

Le modèle Dirichlet a été retenu dans un premier temps car il permet de prédire la répartition d’une variable dans différentes classes en fonction de paramètres [Maier, 2014 – Husson et al., 2018].

Typiquement, dans notre cas d’études, on répartit le linéaire de canalisations dans les différentes classes de diamètres, puis classes de périodes de pose et enfin classes de matériaux retenues. Les classes sont liées entre elles, la somme des proportions dans chacune d’elles devant être égale à 1 pour chaque individu statistique, ici pour chaque commune.

Des modèles Dirichlet ont été calés pour chacune des caractéristiques. La variable modélisée est la part (en %) du linéaire de canalisation au sein d’une classe. Une validation faisant intervenir la méthode de Monte-Carlo a été conduite. 1 000 tirages sont effectués dans l’échantillon de départ; à chaque fois, 75 % sont utilisés pour le calage du modèle, et les 25 % restant pour la validation. Les écarts entre les valeurs constatées et prédites sont représentés dans chacune des boites à moustache de la Figure 17. Ces écarts sont peu importants, mais leurs distributions ne sont pas centrées sur 0 ce qui remet en question le caractère prédictif de ces modèles

Les modèles Dirichlet ont donc été abandonnés.

Figure 17 : Modèles Dirichlet : Ecarts (constaté-prédit)/(Total de toute les classes hors inconnues)

(28)

Modèle multilinéaire

Pour chaque classe de diamètre, période de pose ou matériau, un modèle multilinéaire a été calé. Les grandeurs modélisées sont les longueurs de canalisations de chaque commune dans chacune des classes. La méthode mise en œuvre comporte les étapes suivantes :

- Echantillon de calage

Parmi l’échantillon collecté et pour chaque caractéristique (diamètre, période de pose et matériau), seules les communes pour lesquelles la part d’inconnues est inférieure à 10 % sont conservées. Elles constituent l’échantillon de calage.

- Construction du modèle

Le modèle est construit par une méthode de régression avec sélection ascendante des covariables pas à pas (Stepwise). Cette procédure consiste à ajouter les variables par étape les unes après les autres, en vérifiant à chaque fois la pertinence des variables déjà sélectionnées.

A l’issue de ces traitements, le choix des variables retenues est validé en fonction de la significativité de leur lien avec la variable à expliquer. Les termes d’interaction non-significatifs sont éliminés. En l’occurrence, les variables dont la p-value calculée est supérieure à 5 % n’ont statistiquement pas de relation avec la variable à expliquer, et ne sont donc pas retenues dans le modèle final.

Pour chaque modèle, les variables et les coefficients sont décrits en annexes 8 à 11) (Chapitres 17, 18, 19 et 20).

- Validation

La validation croisée de chaque modèle est réalisée en faisant intervenir la méthode de Monte-Carlo. 1 000 tirages sont effectués dans l’échantillon de départ ; à chaque fois, 75 % sont utilisés pour le calage du modèle, et les 25 % restant pour la validation. Les distributions des écarts relatifs entre les valeurs constatées et prédites aux échelles des Agences de l’Eau et de la France entière sont synthétisés dans des boites à moustaches (également présentées en annexes 7 à 10) (Chapitres 17, 18, 19 et 20).

- Estimation

Deux cas sont distingués pour le calcul des longueurs de canalisation par classe de diamètre, période de pose ou matériau :

- Dans le cas où des données ont été collectées, elles sont conservées uniquement si la part d’inconnues est inférieure à un seuil. Dans ce cas, les longueurs inconnues sont réparties au prorata de l’échantillon connu sur la commune comme suit :

4 G4

4 I × (

4 est la longueur dans la classe i d’une des caractéristiques (diamètre, période de pose ou matériau)

- Pour toutes les autres communes, les caractéristiques du réseau sont estimées par modélisation. La longueur retenue pour la classe i d’une caractéristique (diamètre, période de pose et

matériau) s’exprimera de la façon suivante :

4 4 ' /è( × : ( 4 ' /è( @

4 est la longueur dans la classe i d’une des caractéristiques (diamètre, période de pose ou matériau)

Les valeurs négatives issues des estimations sont ramenées à 0.

Les résultats prédits par agence résultent de la somme de ces deux types de données (calcul au prorata pour les données collectées et estimation par modélisation pour les autres).

(29)

Modélisation des diamètres

5.2.

Echantillon de données

L’échantillon des données de calage et de validation est construit à partir du jeu de données SIG et inventaires. Sur les 16 150 communes et 412 000 km de canalisations collectés, seules sont retenues :

- Les communes dont la totalité du réseau est connu ;

- Les communes dont la part des canalisations de diamètre inconnu est inférieure à 10%.

En complément, les 10 communes les plus importantes (Paris, Marseille, Lyon, Toulouse, Nice, Nantes, Strasbourg, Montpellier, Bordeaux et Lille) sont écartées pour éviter qu’elles induisent de par leur poids un biais dans le modèle (elle représente environ 10 000 km).

Il reste 11 865 communes et 355 094 km dans la base de calage du modèle.

Estimations

Les modèles sont utilisés pour estimer la répartition des diamètres sur l’ensemble des communes. Les données réelles sont conservées si la part d’inconnues est inférieure au seuil de 40 %. Dans ce cas, les inconnues sont réparties au prorata de l’échantillon connu sur la commune.

Pour les autres caractéristiques la part d’inconnues maximale retenue pour l’application du prorata est de 10 %. Cependant, pour l’estimation du diamètre, ce seuil à volontairement été majoré à 40 % car il est apparu que l’application d’un seuil de 10 % introduisait un biais de surreprésentation des grands services (villes, grands syndicats) et conduisait à une surestimation notable des longueurs de conduites de diamètre important,

Dans le cas contraire (part d’inconnues supérieure à 40%), le modèle est utilisé pour évaluer la totalité de la répartition des diamètres.

Les calculs sont détaillés en annexe 7 (Chapitre 17)

Le bilan de la répartition modélisée est détaillé dans le Tableau 7, puis comparé à l’échantillon des données collectées pour chaque agence dans le Tableau 8 et la Figure 18. Les proportions constatées des classes de diamètre dans le Tableau 8 sont calculées hors inconnues (le pourcentage des inconnues est rappelé pour mémoire en fin de tableau).

Tableau 7 : Répartition des linéaires estimés par diamètre et par agence de l’eau en km

AEAG AELB AESN AEAP AERM AERMC FRANCE

300 mm 4 006 10 187 7 053 2 403 2 661 9 193 35 504 200 – 250 mm 9 895 17 341 11 345 4 143 4 159 15 910 62 792 125 – 150mm 25 717 49 792 31 859 8 125 10 704 38 611 164 807 100 mm 31 410 49 232 29 016 10 686 11 147 44 423 175 914 60-80 mm 42 689 68 144 35 453 9 438 6 946 37 812 200 482 50 mm 81 520 93 983 27 581 4 717 2 691 24 973 235 465 Total 195 236 288 679 142 307 39 512 38 308 170 922 874 963

(30)

Tableau 8 : Proportions des diamètres constatées sur l’échantillon collecté et prédites sur l’ensemble des territoires

AEAG AELB AESN AEAP AERM AERMC FRANCE

Const Préd Const Préd Const Préd Const Préd Const Préd Const Préd Const Préd

300 mm 2,3 2,1 4,1 3,5 7,8 5,0 7,8 6,1 8,1 6,9 7,0 5,4 4,8 4,1 200 – 250 mm 5,4 5,1 6,9 6,0 9,1 8,0 10,0 10,5 12,2 10,9 9,8 9,3 7,5 7,2 125 – 150mm 13,1 13,2 17,8 17,2 19,6 22,4 17,7 20,6 26,9 27,9 22,2 22,6 17,7 18,8 100 mm 15,9 16,1 18,8 17,1 25,9 20,4 30,7 27,0 30,9 29,1 26,2 26,0 21,0 20,1 60-80 mm 22,0 21,9 22,7 23,6 21,4 24,9 23,1 23,9 16,0 18,1 21,0 22,1 21,9 22,9 50 mm 41,3 41,8 29,7 32,6 16,1 19,4 10,6 11,9 5,8 7,0 13,7 14,6 27,1 26,9 Rappel Inconnues 6,8 2,3 2,5 1,6 2,3 5,7 5,4

Figure 18 : Proportions cumulées des longueurs par diamètre constatées (Const) et prédites(Pred)

A l’échelle de chaque Agence de l’eau, on remarque que la proportion prédite des conduites d’un diamètre de moins de 50 mmm est toujours supérieure à la proportion constatée dans les données collectées. Cela indique que la modélisation permet bien de corriger le biais de surreprésentation des grands services dans l’échantillon. On remarque qu’à l’échelle nationale il n’en est pas de même, les proportions constatées et prédites sont très proches. Ceci s’explique par le fait que la proportion prédite à

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% P a rt d u l in é a ir e t o ta l p o s é >= 300 mm 200-250 mm 125-150 mm 100 mm 60-80 mm <= 50 mm

AEAG AELB AESN AEAP AERM AERMC France

(31)

l’échelon national résulte aussi des corrections apportées par la modélisation de la longueur des réseaux de chacune des Agence de l’eau. Ainsi la correction de la surreprésentation d’AEAG et AEAB (qui ont les plus fortes proportions de conduites de petit diamètre) dans l’échantillon a un effet inverse à celui de la correction de la surreprésentation des grands services à l’échelle des Agences de l’eau.

Modélisation des périodes de pose

5.3.

Echantillon de données

Les périodes de pose sont souvent mal renseignées. Pour améliorer le calage, les communes dont les périodes de pose inconnues sont supérieures à 10 % ne sont pas retenues.

Dans ces conditions, le modèle est calé avec 6 752 communes, soit 191 501 km, et les inconnues ne représentent plus, en moyenne, que 2% des données.

Estimations

Les modèles sont utilisés pour estimer la répartition des périodes de pose sur l’ensemble des communes. Compte tenu de la forte proportion de communes dont les périodes de pose sont mal renseignées, le seuil de 10% d’inconnues est pris en compte pour décider si la répartition est basée sur les données collectées ou sur les modèles.

Les calculs sont détaillés en annexe 8 (Chapitre 18).

Les résultats des estimations sont détaillés dans le Tableau 9, puis sont comparés à l’échantillon des données collectées dans le Tableau 10 et la Figure 19. Les proportions constatées des classes de période de pose dans le Tableau 10, sont calculées hors inconnues (le pourcentage des inconnues est rappelé pour mémoire en fin de tableau).

Tableau 9 : Répartition des linéaires estimés par période de pose et par agence de l’eau en km

AEAG AELB AESN AEAP AERM AERMC FRANCE

> 1990 42 962 69 317 25 798 11 178 12 636 53 495 215 386 1981 - 1990 14 912 37 168 12 890 3 667 4 079 19 031 91 747 1971 - 1980 52 386 100 448 36 451 6 330 6 680 31 578 233 874 1966 - 1970 24 899 26 392 16 693 4 447 2 745 16 348 91 524 1946 - 1965 52 325 46 775 33 622 10 891 7 620 38 881 190 115 <= 1945 7 751 8 578 16 854 2 999 4 548 11 588 52 318 Total 195 236 288 679 142 307 39 512 38 308 170 922 874 963

(32)

Tableau 10 : Proportions des périodes de pose constatées sur l’échantillon collecté et prédites sur l’ensemble des territoires

AEAG AELB AESN AEAP AERM AERMC FRANCE

Const Préd Const Préd Const Préd Const Préd Const Préd Const Préd Const Préd

> 1990 24,3 22,0 29,8 24,0 22,7 18,1 28,3 28,3 35,0 33,0 35,1 31,3 28,6 24,6 1981 - 1990 7,8 7,6 14,4 12,9 10,3 9,1 9,5 9,3 11,3 10,6 13,5 11,1 11,8 10,5 1971 - 1980 24,2 26,8 32,3 34,8 20,2 25,6 17,0 16,0 15,6 17,4 17,2 18,5 25,2 26,7 1966 - 1970 13,2 12,8 8,0 9,1 9,2 11,7 11,6 11,3 5,8 7,2 10,2 9,6 9,8 10,5 1946 - 1965 27,2 26,8 13,3 16,2 18,9 23,6 25,6 27,6 18,5 19,9 18,0 22,7 18,9 21,7 <= 1945 3,2 4,0 2,1 3,0 18,7 11,8 7,9 7,6 13,8 11,9 6,0 6,8 5,6 6,0 Rappel Inconnues 40,2 26,0 27,3 17,1 16,0 35,5 30,8

Figure 19 : Proportions cumulées des longueurs par période de pose constatées (Const) et prédites(Pred)

A l’échelle nationale, comme pour la plupart des Agences de l’eau, on constate que la prédiction de proportion des canalisations posées après 1990 est inférieure à la proportion constatée dans les données collectées. Cela indique qu’il y a bien correction du biais pressenti de surreprésentation des canalisations anciennes dans les inconnues. On notera toutefois que ce biais n’apparait pas pour les conduites posées avant 1945, cela est dû au fait qu’au sein de l’échantillon collecté, les services urbains dont les données

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% P a rt d u l in é a ir e t o ta l p o s é >1990 1981-1990 1971-1980 1966-1970 1946-1965 < =1945

AEAG AELB AESN AEAP AERM AERMC France

Figure

Figure 4 : Longueur totale, modèle route 250 : Validation croisée par AE – Lecture d’une boite à moustache
Figure 5 : Longueur totale, modèle amélioré : Linéaire prédit en fonction du linéaire constaté - Validation  croisée par AE
Figure 7 : Taux de collecte estimé du linéaire de canalisations par bassin hydrographique
Figure 8 : Répartition par agence de l’eau des longueurs de réseau totales estimées et collectées
+7

Références

Documents relatifs

1) Établissement de l’état des lieux de la gestion de l’information dans le secteur de l’Eau du Tensift. 2) Définition claire et cohérente des différentes fonctions/processus

- Les ressources locales à partir des calcaires ou encore des eaux d’ennoyage peuvent constituer une base pour I’AEP des collectivités mais elles ne doivent pas être utilisées

A cet effet, le Ministère de l’Ecologie et du Développement Durable (MEDD) a souhaité la mise en place de deux types d’échel- les, la première basée sur les dommages [1], la

Après un premier colloque International sur les Wine Studies organisé à Londres en 2016, le Wine Studies Research Network de l’Université de Newcastle, est heureux d’annoncer

Pour les campagnes de septembre 2013 et de mars 2014, les affluents mesurés ne fournissent que 35 % et  39  % du débit observé à l’exutoire du bassin (Sem 9) pour chaque campagne

Il a contribué à documenter le service « production de biens ani- maux » (incluant viandes, lait, œufs, animaux vifs) dans l’étude. Le niveau PRA a été choisi pour une

Le présent document constitue le Plan de Gestion Environnementale et Sociale (PGES) du projet de construction et de réhabilitation de blocs sanitaires au niveau de neuf

Il a contribué à documenter le service « production de biens ani- maux » (incluant viandes, lait, œufs, animaux vifs) dans l’étude. Le niveau PRA a été choisi pour une