• Aucun résultat trouvé

Le choix des variables de segmentation influe grandement sur la constitution des groupes issus de la segmentation. Ces variables doivent être suffisamment discriminante pour pouvoir constituer des groupes de mobilité ayant des comportements de mobilité suffisamment distincts.

a.) Choix des variables

De nombreuses variables peuvent être considérées dans un premier temps comme a priori explicatrices des profils de mobilité :

Les variables retenues doivent rendre compte des caractéristiques des ménages et

notamment de leur composition en termes de nombre d’individus dans le foyer et d’âge de ces individus ;

Le statut de la personne ; étudiant, retraité, actif … ;

L’âge de la personne ;

Le sexe de la personne ;

La localisation du ménage dans un certain environnement : urbain, périurbain, rural,

dense, peu dense … ;

La motorisation, à savoir la possession du permis, d’une voiture, la disponibilité des

véhicules au sein d’un ménage ;

Type de contrat pour les actifs ;

Distance au lieu de travail pour les actifs ou au lieu d’étude pour les scolaires et

étudiants ;

Les revenus du ménage ;

Etc.…

Le choix des variables d’entrée se fait principalement par test, en évaluant leur pouvoir discriminant dans la construction des arbres, mais également en déterminant si elles peuvent être prise en compte dans un objectif de modèle prospectif. Ainsi les revenus des ménages peuvent être de bons indicateurs de comportements de mobilité, mais les prévisions d’évolution dans le temps est très difficile à estimer. Les revenus dépendent du contexte économique actuel mais également de nombreuses autres variables difficilement évaluables.

Concernant la localisation des ménages, dans le cas du modèle de Montpellier, la distance au lieu de travail/d’étude n’est pas une donnée disponible pour tous les individus de l’EDGT, cette donnée n’est donc pas exploitable.

TFE E. LOUBOUTIN Août 2017

Page 38 b.) Catégorisation des variables

Nous avons vu que le choix des variables est dimensionnant pour les groupes de mobilité, mais la catégorisation des variables l’est tout autant. Pour définir quelle catégorisation de variables est la plus pertinente, il est possible de comparer les différents arbres de segmentation obtenus avec des catégorisations différentes. Cette comparaison est ici basée sur la détermination d’une distance moyenne entre la répartition des profils de chaque groupe de mobilité déterminé et la répartition des profils de mobilité de la population totale des individus de l’EDGT. Plus cette distance est grande plus les groupes ont des comportements de mobilité distincts et plus la qualité de la segmentation est bonne. Comme nous l’avons vu précédemment, l’algorithme CHAID segmente de manière séquentielle la population en groupes de mobilité en fonction d’un test de khi2. Les données de sortie de l’algorithme sont : une définition de chaque groupe par catégorie de variable, le nombre d’individus dans chaque groupe de mobilité, et la fréquence d’occurrence de chaque profil de mobilité dans le groupe de mobilité.

Formule de distance du Khi2 : soient Xi (∈[0 :66]) la fréquence d’occurrence du profil de mobilité i sur l’ensemble des individus enquêtés de l’EDGT et x1i la fréquence d’occurrence du profil de mobilité dans le groupe de mobilité 1.

Distance pour un groupe :

(𝑋𝑖−𝑥1𝑖)

²

𝑋𝑖

∀𝑥1𝑖>0

La distance du khi2 est alors la moyenne des distances entre les fréquences des profils de mobilité de chaque groupe de mobilité et les données de fréquences des profils de mobilité sur la population totale. Cette distance est également pondérée par le nombre d’individus par groupe de mobilité. Ce calcul permet de déterminer si les valeurs pour les comportements de mobilité de la population totale sont suffisamment distinctes de celles des différents groupes de mobilité.

NB : les tests ci-dessous sont calculés à partir des arbres pour chaque sous classe de la variable explicative. En effet, un nombre élevé de classes pour la première segmentation induisait un bug sur la construction de l’arbre total par le CHAID.

 L’âge

Pour l’âge de la personne, divers regroupements sont possibles en fonction des objectifs : une catégorisation en peu de catégories (exemple : 52-14 ans, 15-29 ans, 30-44 ans, 45-59

ans, 60-74 ans, plus de 75 ans) ou bien plus précise en 10 catégories (5-10 ans, 11-14 ans, 15-17 ans, 18-24 ans, 25-39 ans, 40-49 ans, 50-59 ans, 60-69 ans, 70-79 ans, plus de 80 ans). Cet arbitrage des catégories des âges est important dans cette étude car il a été observé que l’âge est, en premier lieu, la variable la plus discriminante pour expliquer les profils de mobilité de l’EDGT.

Les catégories d’âges testées sont :

AGE1 (10

catégories) 5-10ANS, 11-14ANS, 15-17ANS, 18-24ANS, 25-39ANS, 40-49ANS, 50 -59ANS, 60-69ANS, 70-79ANS, +80ANS

AGE2 (6

catégories) 5-14ANS, 15-29ANS, 30-44ANS, 45-59ANS, 60-74ANS, +75ANS

AGE3 (9

catégories) 5-10ANS, 11-17ANS, 18-29ANS, 30-39ANS, 40-49ANS, 50-59ANS, 60-69ANS, 70-79ANS, +80ANS

AGE4 (8

catégories) 5-10ANS, 11-17ANS, 18-29ANS, 30-39 ANS, 40-49ANS, 50-59ANS, 60-74ANS, +75ANS

La catégorisation AGE1 est la plus précise avec 10 catégories. L’idée est donc de tester si cette précision est nécessaire en la comparant à des catégorisations moins segmentées. La catégorisation AGE2 a le moins de catégories et correspond à la nomenclature de l’INSEE. Cependant la segmentation à 18 ans n’est pas présente, elle est pourtant intéressante à exploiter.

La catégorisation AGE3 respecte la segmentation à 18 ans et regroupe les classes 11-14 ans et 15-17 ans. La classe des jeunes adultes est aussi augmentée en comparaison avec AGE1 :18-29ans.

Enfin, la catégorisation AGE4 reprend celle de AGE3 en changeant les classes des personnes les plus âgées : 60- 74 ans et +75 ans.

2 Rappel : seuls les individus de 5 ans et plus ont été interrogés sur leurs déplacements

TFE E. LOUBOUTIN Août 2017

Page 40 Les résultats pour les tests de catégories d’âges (avec STATUT3, MENAGE1 et MOTORISATION1, définis par la suite) sont :

AGE1 (10 catégories) 2.94 2.70 39 AGE2 (6 catégories 2.17 2.08 31 AGE3 (9 catégories) 2.67 2.64 34 AGE4 (8 catégories) 2.65 2.65 35

La classification en 10 catégories est donc la plus précise. Entre les classifications AGE3 et AGE4 il y a peu de différences malgré le groupe supplémentaire pour AGE4, qui est moins précis. La classification AGE2 est sans surprise la moins précise, elle a moins de groupes et ne segmente pas la population à 18 ans. Cette dernière classification est d’autant plus différente des autres qu’elle donne un arbre avec comme première variable explicative les statuts.

En parallèle un test a été effectué en retirant les étudiants de la base totale. L’arbre obtenu segmente la population en premier lieu avec les statuts. On peut en déduire que la catégorie des 15-29 ans est très disparate en termes de mobilité et le grand nombre d’étudiants sur le grand territoire Montpelliérain influe grandement la segmentation (NB : les étudiants sont légèrement surreprésentés dans l’EDGT avec 3% de plus que ce qu’annonce les données INSEE sur les mêmes communes du périmètre, cette surreprésentation ne peut cependant pas expliquer à elle seule ces observations).

Comparaison de arbres des variantes AGE1, AGE3 :

Figure 15 : AGE1 11-14 ANS

Figure 16 : AGE1 15-17 ANS

Figure 17 : AGE3 11-17ANS

On observe que la densité explique plus les profils de mobilité que la composition du ménage pour les 11-17ans, malgré le nombre plus important d’individus dans la catégorie 11-14ans. Figure 18 : AGE1 18-24ANS

ACTIFS

TFE E. LOUBOUTIN Août 2017

Page 42 Figure 19 : AGE3 18-29

Les décompositions des 2 catégories se font selon les mêmes variables, la catégorie 18-29 ans donnant logiquement plus de groupes. Les principales différences sont le nombre beaucoup plus important d’individus dans les 18-29 ans (2180 contre 1431 pour les 18-24ans), augmentant de ce fait le nombre d’actifs, au foyer et autres statuts, et la variable densité qui est explicative pour AGE1 18-24 ANS.

Comparaison de arbres des variantes AGE3, AGE4 :

La seule variable explicative pour les classes des 70-79ans et +80ans est le sexe, pour les +75ans, la composition des ménages influent également.

Figure 20 : AGE4 +75ANS

AU FOYER, AUTRES

La classe des 60-74 ans donne 2 groupes de mobilité en plus et apporte ainsi plus de similarité au sein des groupes.

Figure 21 : AGE3 60-74ANS

TFE E. LOUBOUTIN Août 2017

Page 44 En conclusion, la catégorisation qui semble la plus précise est AGE1 avec le regroupement des 60-74ans et des +75ans. Les résultats pour cette nouvelle catégorisation sont présentés ci-dessous.

AGE5 (9

catégories) 2.83 2.71 38

La distance moyenne est plus faible que pour AGE1 mais la distance pondérée est légèrement plus élevée. Le nombre plus important de groupes de mobilité créés dans la catégorisation AGE1 tend néanmoins à privilégier le choix de cette dernière pour la segmentation finale.

 Le statut

De la même manière le statut de la personne peut se diviser en 6 grandes catégories : les actifs, les étudiants, les scolaires, les retraités, les personnes au foyer et les autres catégories. Les actifs peuvent être plutôt bien identifiés grâce aux modalités de l’EDGT (occupation principale : travail à temps plein, travail à temps partiel, apprentissage/formation/stage, étudiants, scolaires jusqu’au BAC, chômeurs, retraités, au foyer, autres), de même pour les retraités et au foyer. Cependant, pour les étudiants et scolaires, les modalités sont plus floues dans les données de l’INSEE et ne permettent pas de les identifier de manière précise sur les mêmes critères que pour l’EDGT (cf. partie 2.5 « Segmentation en groupes de mobilité »). Pour différencier les étudiants et les scolaires, plusieurs variantes peuvent être testées en combinant diverses modalités de l’EDGT.

Les catégories testées pour le statut sont :

STATUT1 (6

catégories) ACTIFS (temps plein, temps partiel, apprentissage/formation/stage), ETUDIANTS DE MOINS DE 14ANS, ETUDIANTS DE 14ANS ET PLUS, RETRAITES, AU FOYER, AUTRES (au chômeurs)

STATUT2 (6

catégories ACTIFS (temps plein, temps partiel, apprentissage/formation/stage), ETUDIANTS DE MOINS DE 18ANS, ETUDIANTS DE 18ANS ET PLUS, RETRAITES, AU FOYER, AUTRES (inclus chômeurs)

STATUT3 (5

catégories) ACTIFS (temps plein, temps partiel, apprentissage/formation/stage), ETUDIANTS, RETRAITES, AU FOYER, AUTRES (inclus chômeurs)

CODE Distance Distance pondérée Nombre de groupes de mobilité

Les chômeurs ayant des caractéristiques et donc des comportements de mobilité très différents, il est délicat de les mettre dans une catégorie séparée des autres. De plus, ils ne représentent que 7% des individus enquêtés sur leurs déplacements lors de l’EDGT.

La catégorie des étudiants regroupe les scolaires jusqu’au BAC et les étudiants, avec une séparation par âge pour les variantes 1 et 2. Cette limite d’âge peut être envisagée à 14 ans quand les individus peuvent commencer à travailler et avoir une certaine indépendance de mobilité (permis 2 roues <50cm3) ou bien à la majorité à 18 ans, où une réelle différence de comportements de mobilité peut être observée (lieux d’études hors de la zone du foyer familial, permis…).

La construction des arbres de segmentation pour les 3 types de catégorisation (autres catégorisations fixes, AGE1, MENAGE1 ET MOTORISATION1) a donné ces résultats :

STATUT1 (6 catégories) 3.08 2.71 40 STATUT2 (6 catégories 2.93 2.70 39 STATUT3 (5 catégories) 2.94 2.70 39

On observe que la segmentation à 18 ans (STATUT2) ne fait pas varier la distance moyenne par rapport à la catégorisation avec aucune segmentation pour les étudiants (STATUT3). Ceci s’explique par le fait que les classes d’âges segmentent déjà en amont les individus de moins de 18 ans et de plus de 18 ans, les segmentations ne diffèrent donc pas. La meilleure segmentation est ici celle avec la limite d’âge des étudiants/scolaires à 14 ans.

La catégorisation STATUT1 a également été testée en la croisant avec le classe d’âge 3 qui ne segmente pas les individus à 14 ans. La combinaison était moins concluante.

STATUT1 (6 catégories) avec CLASSE AGE3 2.67 2.64 34

CODE Distance Distance pondérée Nombre de groupes de mobilité

TFE E. LOUBOUTIN Août 2017

Page 46 Enfin, la catégorisation STATUT1 a été testée avec une nouvelle catégorisation AGE6. Cette dernière modifie les classes 11-14ans et 15-17ans de AGE1 en 11-13ans et 14-17ans pour tenir compte de la segmentation des étudiants à 14ans dans STATUT1. Les résultats sont présentés ci-dessous : STATUT1 (6 catégories) avec CLASSE AGE6 2.83 2.70 38

Ces résultats sont logiquement identiques au test STATUT3 avec AGE6. En effet, la segmentation à 14 ans ou aucune segmentation des étudiants ne change rien car la segmentation à 14 ans est déjà opérée par la catégorisation de l’âge.

En conclusion la catégorisation de statut la plus pertinente est STATUT1. Cette dernière sera gardée comme variable fixe pour les tests suivant.

 Les ménages

Les ménages sont enquêtés dans l’EDGT en interrogeant l’ensemble des individus du ménage. Une personne référente est alors définie comme étant l’homme le plus âgé du ménage ou à défaut la personne la plus âgée du ménage. Toutes les personnes interrogées sont alors caractérisées par leur relation avec la personne référente de leur ménage d’appartenance. Pour les types de ménages, les catégories sont plutôt évidentes et peuvent se décomposer comme suit : les célibataires, les couples sans enfant, les couples avec enfants, les personnes seules avec enfants, les autres ménages. Des précisions peuvent néanmoins être définie notamment sur l’âge des enfants du ménages. Une limite d’âge est donc à définir qui va déterminer des différences majeures en termes de comportements de mobilité des ménages avec enfants. Une première limite pourrait être identifiée à 18 ans, les enfants gagnant en indépendance avec la majorité. Cependant une autre limite pourrait être imaginée en séparant les ménages composés de couples avec au moins un des enfants de moins de 10 ans ou moins et ceux avec des enfants de 11 ans et plus, de même pour les ménages d’une seule personne avec des enfants.

Les catégorisations de ménages testées sont :

MENAGE1 (5 catégories)

CELIBATAIRES, COUPLES SANS ENFANT, COUPLES AVEC ENFANTS DE -18 ANS, SEULS AVEC ENFANTS DE -18ANS, MENAGES DE 2 ADULTES ET +

MENAGE2 (7 catégories)

CELIBATAIRES, COUPLES SANS ENFANT, COUPLES AVEC AU MOINS UN ENFANT DE 10 ANS OU MOINS, COUPLES AVEC AU MOINS UN ENFANT ENTRE 11 ET 17 ANS, SEULS AVEC AU MOINS UN ENFANT DE 10 ANS OU MOINS, SEUL AVEC AU MOINS UN ENFANT ENTRE 11 ET 17

ANS, MENAGES DE 2 ADULTES ET +

La catégorie des célibataires comprend les ménages composés strictement d’une personnes seule.

La catégorie des couples sans enfant comprend les ménages composés strictement d’un couple.

La catégorie des couples avec enfants de moins de 18 ans comprend les ménages composés d’un couple avec au moins un enfant de moins de 18 ans et éventuellement d’autres adultes. Cette catégorie est séparée en 2 dans la catégorisation MENAGE2 en distinguant les couples avec au moins un enfant de 10 ans ou moins, et les couples avec des enfants de 11 ans ou plus (<18ans).

La catégorie des personnes seules avec enfants de moins de 18 ans comprend les ménages composés d’une personne seule avec au moins un enfant de moins de 18 ans et éventuellement d’autres adultes. Cette catégorie est séparée en 2 dans la catégorisation MENAGE2 en distinguant les personnes seules avec au moins un enfant de 10 ans ou moins, et les personnes seules avec des enfants de 11 ans ou plus (<18ans).

La catégorie des ménages de 2 adultes ou plus comprend tous les autres types de ménages (couples avec enfants tous majeurs, personnes seules avec enfants tous majeurs, colocations…)

La construction des arbres de segmentation pour les 2 types de catégorisation (autres catégorisations fixes, AGE1, STATUT1 et MOTORISATION1) a donné ces résultats :

MENAGE1 (5

catégories) 3.08 2.71 40

MENAGE2 (7

catégories 2.97 2.62 34

CODE Catégories

TFE E. LOUBOUTIN Août 2017

Page 48 La catégorie MENAGE2, pourtant plus précise, produit un nombre plus faible de groupes de mobilité. La distance moyenne étant plus élevée pour la catégorie MENAGE1, c’est un critère pour arbitrer sur la meilleure précision de cette catégorisation. Cela est corrélé au nombre plus important de groupes de mobilité issus de la segmentation, qui ici garantit une répartition plus homogène des occurrences de profils de mobilité dans les groupes terminaux.

De plus, on a pu remarquer que pour la classification MENAGE2, les 11-14 ans ne sont pas segmentés, contrairement à MENAGE1 où la catégorie est segmentée selon la composition du ménage et le statut.

De même pour les 50-59 ans, avec MENAGE1, ils sont segmentés en 4 groupes (statuts, puis composition des ménages), dans MENAGE2 ils sont segmentés en seulement 2 groupes. Enfin, pour la catégorie des 25-39 ans, il y a deux groupes de mobilité supplémentaires pour la catégorisation MENAGE1.

Figure 24 : MENAGE1 25-39 ANS

TFE E. LOUBOUTIN Août 2017

Page 50

 La motorisation

La motorisation peut faire l’objet de diverses catégorisations selon le nombre de véhicules disponibles dans le ménage et le nombre de personnes ayant le permis dans le ménage. La modalité « possession du permis » n’étant pas disponible dans les données de l’INSEE cette variable n’a pas pu être prise en compte directement pour la détermination des catégories (cela aurait donné un groupe non applicable à la population synthétique basée sur les données de l’INSEE entre autres).

Pour simuler la variable possession du permis, il a été décidé de recenser par ménage le nombre de personnes de 25 ans et plus. La limite peut également être envisagée à 18 ans bien que dans la structure actuelle de la population, les jeunes passent de plus en plus tard le permis et souvent à l’occasion d’un premier emploi en fin d’études.

Trois catégories ont ensuite été créées :  Pas de véhicule dans le ménage,

 Moins de véhicules que de personnes de 25 ans et plus dans le ménage : compétition,  Plus de véhicules que de personnes de 25 ans et plus dans le ménage : pas de

compétition.

Pour les retraités, trois catégories particulières ont été identifiées :  Non motorisé,

 Possession d’un véhicule,

 Possession de deux véhicules ou plus.

En effet, les retraités de l’EDGT sont à 90% en couple sans enfant ou célibataire, il n’y a donc généralement pas de cas de « compétition » pour l’usage des véhicules.

Les catégories testées pour la motorisation sont :

CODE Catégories

MOTO1 (6 catégories)

RETRAITES NON MOTORISES, RETRAITES AYANT 1 VEHICULE, RETRAITES AYANT 2 VEHICULES OU PLUS, AUTRES INDIVIDUS NON MOTORISES, AUTRES INDIVIDUS COMPETITION

(25ANS), AUTRES INDIVIDUS PAS DE COMPETITION (25ANS) MOTO2 (6

catégories

RETRAITES NON MOTORISES, RETRAITES AYANT 1 VEHICULE, RETRAITES AYANT 2 VEHICULES OU PLUS, AUTRES INDIVIDUS NON MOTORISES, AUTRES INDIVIDUS COMPETITION

La construction des arbres de segmentation pour les 2 types de catégorisation (autres catégorisations fixes) a donné ces résultats :

MOTO1 (6

catégories)

3.08

2.71

40

MOTO2 (6

catégories

3.05

2.70

41

La distance moyenne est légèrement plus élevée pour la catégorisation avec segmentation à 25 ans. La catégorisation avec segmentation à 18 ans induit un groupe supplémentaire dans la catégorie des 40-49 ans et les définitions des groupes changent pour les catégories 18-24 ans et 25-39 ans. Ces résultats confirment une meilleure segmentation pour 18-24 ans et les 25-39 ans avec un seuil « d’individus capables de conduire » à 25 ans. Le groupe supplémentaire dans les 40-49 ans est vraisemblablement une conséquence de l’augmentation du nombre de ménages en compétition pour l’utilisation des véhicules avec la segmentation à 18 ans.

En conclusion, la segmentation la plus adéquate selon le critère de distance moyenne est la combinaison des variables : AGE1, STATUT1, MENAGE1 et MOTORISATION1 (avec MOTORISATION2 les résultats sont assez similaires, cette combinaison peut également être envisagée). En effet, la distance moyenne est la plus élevée pour cette combinaison et garantie donc une bonne répartition des individus dans les groupes de mobilité en maximisant la diversité des comportements de mobilité entre les groupes.

En annexe 3 est détaillée la segmentation de chaque sous-classe d’âges pour la combinaison AGE1, STATUT1, MENAGE1 et MOTORISATION1.

 Proximité arrêts de transport en commun

Dans un dernier temps, une nouvelle variable a été ajoutée pour tester l’influence de la présence d’arrêts de transport en commun (bus et tramway) à proximité du domicile des individus sur les comportements de mobilité.

Cette variable a été classifiée en 3 catégories :

 Aucun arrêt de transport en commun dans la zone fine du domicile de l’individu

 Présence d’au moins un arrêt de bus dans la zone fine du domicile de l’individu

 Présence d’au moins un arrêt de tramway dans la zone fine du domicile de l’individu

Documents relatifs