L’analyse harmonique qualitative et son application à la typologie de trajectoires individuelles

(1)

HAL Id: hal-02478104

https://hal.archives-ouvertes.fr/hal-02478104

Submitted on 13 Feb 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

typologie de trajectoires individuelles

Olivier Barbary, Luz Mary Pinzon Sarmiento

To cite this version:

Olivier Barbary, Luz Mary Pinzon Sarmiento. L’analyse harmonique qualitative et son application à la typologie de trajectoires individuelles. Mathématiques et Sciences Humaines, Centre de Mathématique Sociale et de statistique, EPHE, 1998. �hal-02478104�

(2)

O

LIVIER

B

ARBARY

L

UZ

M

ARY

P

INZON

S

ARMIENTO

L’analyse harmonique qualitative et son application à la

typologie des trajectoires individuelles

Mathématiques et sciences humaines, tome 144 (1998), p. 29-54. <http://www.numdam.org/item?id=MSH_1998__144__29_0>

© Centre d’analyse et de mathématiques sociales de l’EHESS, 1998, tous droits réservés. L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://msh.revues. org/) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/legal. php). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

(3)

L’ANALYSE

_HARMONIQUE

_QUALITATIVE

ET SON APPLICATION

À

LA TYPOLOGIE DES TRAJECTOIRES

INDIVIDUELLES

Olivier

BARBARY1,

Luz

_Mary

PINZON

SARMIENTO2

RÉSUMÉ 2014 Cet article _présenteune _{synthèse théorique}et _pratiquede

_{«l’analyse}

_harmonique qualitative» en tant _qu’outilde _{statistique descriptive}de _processusaléatoires, et son _applicationà l’étude de la mobilité humaine. Dans la _premièrepartie, on s’intéresse, d’un _pointde vue _{mathématique,}à l’analyse harmonique d’un processus qualitatif et à son _{approximation}_par_l’analysede

_{correspondance}

du tableau des durées de _séjourdes individus dans les états

_possibles

du

_processus3.

La deuxième et la troisième _partiesont

consacrées à une _applicationaux données d’une _enquêtesur la mobilité résidentielle et _{professionnelle,}et les événements _familiaux_queconnaissent les résidents de l’aire _{métropolitaine}de _Bogota.On _ymontre comment

la méthode _fournitune typologie des trajectoires intra-urbaines et _permetde la mettre en relation avec d’autres éléments de la

_biographie

des individus.

SUMMARY 2014 Nominal harmonic _{analysis applied}to individual _{trajectories typology}

The article aims at a theoretical and practical presentation «nonominal harmonic analysis» as a tool _for descriptive statistic _{of categorical}stochastic processes and its

application

to human

_mobility

studies. The _first part is a mathematical overview of the extension of scalar spectral analysis to a _categorical_processand how it

can be _{approximate by}a

_particular

kind of correspondences analysis based on times that individuals accumulate in _{the process}states. The second and third _{parts deal}with

_application

to a data set taken _froma

survey on residential _mobilityin _Bogota_metropolitanarea.

_{We found}

the method able to _providean _interesting typology of urban residential _trajectoriesand to show some _{relationships}between residential

mobility

and other

_biographical

variables like _familyevents and _{professional changes.}

INTRODUCTION

La collecte de données

_{biographiques}

est de

_plus

en

_{plus fréquente}

en sciences sociales. Dans l’étude des formes de la mobilité

humaine,

elle tente de

_répondre

à des

_{questionnements}

nouveaux, dans des contextes

thématiques, disciplinaires

et

méthodologiques

variés.

Qu’il

s’agisse

en effet de la mobilité

spatiale,

sociale ou

_économique,

de celle des individus ou des

groupes

sociaux,

d’approches démographiques, géographiques,

économiques

ou

socio-anthropologiques, l’objet

de la recherche est à

_chaque

fois un

_phénomène

continu

_(les

vies

1

Institut de Recherche pour le _{Développement}_(IRD,ex _Orstom),Centro de _{investigaciôn}y Documentaciôn

Socio Econômica (CIDSE) - Universidad del Valle, e-mail : olibarba@mafalda.univalle.edu.co. 2

Universidad Nacional de Colombia, e-mail : _{lpinzon @ ciencias.ciencias.unal.edu.co.} 3

Un programme SAS développé par 0. Barbary, mettant en oeuvre l’ensemble de la _méthode,est _disponiblesur demande à l’auteur.

(4)

humaines sont

_composées

d’une infinité

d’instants,

de

lieux,

d’événements...).

Dès

lors,

même

si aucun

_système

d’observation ne

_peut

prétendre

rendre

_compte

de cette continuité

_{"théorique",}

l’appareil

des

_concepts

et des méthodes de collecte doit viser l’observation la

_plus

exhaustive

possible

du

_temps

et _{des espaces dans}

_lesquels

se déroule la mobilité des hommes.

Récemment,

ce domaine a connu de

grands progrès,

depuis

la définition de nouveaux

_concepts

d’observation

jusqu’à

la réalisation

_{d’enquêtes}

sur des échantillons

représentatifs.

Mais si l’on sait de mieux en mieux collecter les données

biographiques,

de nombreuses difficultés subsistent

_quant

à leur

analyse,

particulièrement

dans le

_champ

de la

_{statistique descriptive}

où font encore défaut des méthodes

_respectant

la richesse et la «continuité» _{des corpus. Alors que la}

_priorité

est

généralement

d’obtenir une

typologie

des

trajectoires

individuelles,

on s’en tient souvent à des

analyses

transversales ou à l’examen d’indicateurs

longitudinaux

monovariés,

nécessairement réducteurs de l’information

_originale.

Cependant,

les

_{acquis méthodologiques}

sur la

statistique descriptive

multivariée des processus se sont diversifiés et deviennent

_prometteurs

_(Van

Der

_Heijden

_{[ 1987]}

est à notre

connaissance la

_synthèse

la

_{plus complète}

à ce

_jour).

Il faut

_revenir,

_{pour situer le}

_point

de

départ

de ces

recherches,

au travail

_pionnier

de Deville et

_{Saporta (Analyse}

_harmonique

qualitative, [1980])

et à la thèse de

_Saporta

_(Université

Paris

VI,

[1981]) ;

c’est là sans aucun

doute _quese fondent au

plan théorique

les méthodes

exploratoires,

et

_{plus précisément}

typologiques, d’analyse

des données

_{biographiques.}

Comme le dit

_Saporta

_{( [ 1981 ],}

_{p. 10)}

dans

une introduction

clairvoyante

à une

époque

où n’existent que très peu de données individuelles

longitudinales

sur des échantillons

importants :

«le

problème ne

sera _pastant de découvrir

des

_{périodicités}

comme le

fait l’analyse spectrale,

_quede trouver les traits dominants de

différenciation

des évolutions des individus».

Nous

_partons

dans ce travail d’une

_{technique déjà éprouvée, l’analyse harmonique}

qualitative

(AHQ),

pour la

compléter

et

l’appliquer

à l’étude de la mobilité

spatiale.

La

justification

théorique

de

l’AHQ

est

_l’objet

de la

_première

_{partie :}

avec cette

_méthode,

_l’analyse

factorielle des

_{correspondances}

_{(Benzecri [1973])}

trouve une nouvelle

_application

à la

_typologie

des données

_{longitudinales.}

La seconde

_{partie présente}

_{rapidement l’enquête}

sur la mobilité des

populations

de l’aire

_{métropolitaine}

de

_Bogota

et décrit les

_étapes

et les

_problèmes

de la mise en

oeuvre de la méthode sur ces données

_{biographiques.}

Dans la troisième

_partie,

à

_partir

de

l’exemple

de certains

_résultats,

nous montrons _quecette

_approche

est maintenant

_{complètement}

opérationnelle,

et tentons d’illustrer ses

_avantages,

ses limites et ses

_{perspectives.}

1.

BRÈVE

THÉORIE

DE L’ANALYSE

_{HARMONIQUE QUALITATIVE}

Nous allons décrire maintenant de manière

_synthétique

les fondements

_théoriques

de

_l’AHQ

jusqu’à

une

propriété

fondamentale dans la

pratique : l’équivalence

avec une

_analyse

de

correspondance

particulière.

Nous _{passerons ensuite}en revue les

_{techniques d’approximation}

numérique

utilisées pour l’exécution de

l’AHQ.

Notre

_{présentation}

s’en tiendra à

_{l’énoncé,}

sans

démonstration,

des

_{principales étapes}

de la

_{justification}

de la méthode. Le lecteur intéressé _par

une

_{présentation}

_{mathématique complète}

doit s’en remettre aux travaux

_Saporta

_{[ 1981 ]}

et Deville

[1982] ;

on trouve dans

_Saporta

_[1996]

une autre

_{présentation}

_synthétique

de la méthode

orientée vers

_l’analyse

des données

_{biographiques.}

l.1.

_Notations,

définitions et

_principe

L’analyse

harmonique

d’un processus

qualitatif

part

de la donnée des éléments suivants :

. _unintervalle de

_temps

T =

[0, T J

munit de la mesure de

_Lebesgue

et

_/3,

l’ensemble des

(5)

· l’ensemble

fini Z

des modalités ou états du processus, de cardinal

m, X

=

~..., ~}

· un ensemble d’unités

statistiques

£2

(ensemble

fini ou non

d’individus),

munit d’une

probabilité

P

· _un

processus X sur Ç2xT à valeur dans x :

1~

étant la variable indicatrice de l’événement

_Xt

= _x,_nous_{noterons :}

, la

probabilité

et

, la

probabilité

Un

_codage

scalaire

_(ou

_réel)

_{du processus}

_X

est une

fonction fde ZxT dans

i :

Bien

_sûr,

dans l’ensemble de tous les

_codages

scalaires de

X,

certains sont

_plus

naturels et

pratiques

que d’autres. Nous considérerons ici les

codages

de carré

intégrable,

c’est-à-dire ceux

qui

vérifient :

Un tel formalisme

_{«probabiliste»}

_peut

_{surprendre s’agissant}

_d’analyse

de données où ce

que l’on observe en fin de

_compte

ne sont _{que des}

_{fréquences. Saporta}

_{([ 1981 ], pp.10-11 )}

s’en

explique :

«si nous avons choisi de

parler

de

’processus’

et de

_{’probabilité’}

là où certains

ne

pourraient

voir que ’courbes’ et

f réquences’,

c’est _quece

langage

nous a semblé le

plus

simple

à utiliser et le mieux

_adapté

au cas d’une

_infinité

non dénombrable de variables. Il

reste

_cependant

_quenous avons

_toujours

eu à

_l’esprit

le

_fait

_queS~

_représente

une

population

d’individus et un _processusun ensemble de

_trajectoires

individuelles».

L’idée directrice du travail de Deville et

_Saporta

est de faire la

_synthèse

de deux

démarches. La

_première

consiste à se donner un

_{codage numérique}

du processus

_qualitatif

et à

en faire

l’analyse

harmonique

(d’où l’appellation

donnée à la

méthode).

La seconde est de

choisir dans T une suite finie

d’instants,

OS

_{tl t2... t~}

_T,

_{pour effectuer}

_{l’analyse canonique}

des variables

_{qualitatives Xtl,}

En fait l’unité des deux

_{approches apparaît}

si l’on traite le

problème

comme celui de la

décomposition spectrale

d’un

opérateur

caractérisant l’évolution

temporelle

du processus

(opérateur

analogue

à celui de la covariance d’un _processus

_scalaire).

1.2.

_L’analyse

_spectrale

d’un _processus

_qualitatif

Soit H

_l’espace

de _{Hilbert des processus aléatoires réels}sur £2XT de carré

_intégrable,

c’est-à-dire Soit le _sous-espace

des _processusconstants dans le

_temps

et

L 2(X)

_{le sous-espace}

_engendré

_{par les}

_codages

(6)

tribu

_engendrée

_par

_Xt.

se _{compose de variables}

réelles, dépendantes

du

_temps,

de la

forme :

L’opérateur

d’espérance

conditionnelle à

_P1,

_{Et (~) =}

_{E (§ / Xt ) ,}

est donc la

_projection

orthogonale

de sur

L2(Xt).

Les

propriétés

de

E t

(E t

est

hermitien,

_idempotent

et de

rang au

plus égal

a m, le nombre

d’états)

et le fait que,

inversement,

tout

opérateur

_ayant

ces

propriétés

est une

_espérance

conditionnelle relative à une variable

qualitative

_ayant

au

_{plus m}

modalités, permettent

de considérer comme

_équivalents

_{l’opérateur}

_Et

et la variable

_Xt.

Les

dépendances statistiques

entre deux instants t et s du _processussont donc résumées _{par le}

produit

K(t, s j

des

_{opérateurs Et}

et

_Es,

fonction de H dans lui-même définie de manière

analogue

à la fonction de covariance :

avec :

où :

Les processus propres et leurs

_{génératrices}

Saporta

[1981,

pp. 101-103]

et Deville

[1982],

pp.

61-62])

démontrent alors que K est

compact

et de trace finie

_égale

à mT. K admet donc une

décomposition spectrale

en vecteurs _propres

çi,

appelés

«processus propres» :

Les ’

sont des _{processus de variance}totale

unité,

_orthogonaux

dans

_H,

associés aux

00

valeurs _propres

_positives

Ai

_(avec

_{1 Â,}

i

_{=mT ),}

satisfaisant

_{l’équation :}

i=l

Le

_produit

tensoriel

_{ç 0 ~ ’}

1

est

_{l’opérateur}

_{de rang 1 de}

_Hqui

transforme le

_{processus 1I’t}

en le processus

T

(7)

Et

_{puisque :}

on a :

On définit maintenant une variable aléatoire

z~ ,

_{appelée génératrice}

du processus propre

où il est _{clair que}

zi

ne

_dépend

_{pas du}

_temps

_{et, par}

conséquent, appartient

au _sous-espace

L2(S2)

de On a donc

~,1~‘ r

=

Et(zi),

c’est-à-dire que

pour

chaque

t, le processus

propre çi

s’obtient par

projection orthogonale

de

/ sur

L2(Xt),

d’où le nom de

_{génératrice.}

En utilisant la nouvelle variable et en

_intégrant

_{l’équation précédente,}

on obtient :

Si nous

_{appelons Q l’opérateur}

1

l’équation

(3)

devient :

L’analyse spectrale

de K

_(processus

_propres

_çi)

dans se déduit donc de

l’analyse

plus

simple

de

_Q

_{(génératrices}

z‘ )

dans

L2(S~).

Les

_codages

_propres

Une autre forme de

_{l’équation}

aux valeurs propres s’obtient en revenant à

_{l’expression}

₍₁₎

de

~t.

En abandonnant l’indice i pour

simplifier

l’écriture, (2)

se transforme en :

(8)

Par

_conséquent,

et, par

identification,

le

_{système d’équations :}

En

_résumé,

les

_équations

₍₄₎

et

₍₅₎

montrent _que

les z’

et les

_at

forment deux

décompositions

spectrales

du processus. Dans la

_première,

la série des variables aléatoires

(z~,

i=l, .... m7)

sont

_{indépendantes}

du

_temps

et dans la

_seconde,

les

_codages

réels non aléatoires

x=l,...,m)

dépendent

du

_temps.

Comme

_l’analyse

_canonique

_{généralisée,}

l’analyse

harmonique qualitative

est basée sur la recherche de deux vecteurs aléatoires de

corrélation maximum. Il

_s’agit

d’identifier l’élément

zi

de

L2(Q)

et le _processusscalaire

(codage

de de

L2(Xt)

_qui

ont la corrélation maximum dans

L2(QxT),

_puis

d’itérer ce _processussous la condition

d’orthonormalité ;

c’est-à-dire de faire

_l’analyse

canonique

des _sous-espaces

L2(S~)

et

L2(X)

dans

1.3.

_Équivalence

avec

_l’analyse

des

_{correspondances}

et

_{approximation numérique}

de

_l’AHQ

Supposons

maintenant

_qu’il

_{existe p}

+ 1 instants _{tels que le processus}

soit stable sur

_chaque

intervalle

_{jtj_1 ,}

c’est-à-dire

_qu’aucun

individu ne

_change

d’état

durant ce

_temps.

Soit 4j

le

codage

_propresur

_{E j}

_{l’espérance}

conditionnelle à

_~j

et

_lj

la

_longueur

de

_{l’ intervalle j}

_{(l j = tj - tj_ 1 ) ;}

_{l’équation}

₍₂₎

devient :

et

_puisque

Étant

_{donné que les}

_codages

_{propres associés}aux

_{variables 4k}

sont des fonctions

constantes sur chacun des intervalles de la

partition

de

_T,

le

_{système d’équations}

₍₅₎

s’écrit de la manière suivante :

(9)

Cette nouvelle forme

_(5’)

_correspond

à

_{l’équation}

fondamentale de

_{l’analyse canonique}

généralisée. Quand

f2 est

_fini,

_composé

de n

individus,

on retrouve une

_analyse

de

correspondance

particulière

(voir

G.

_Saporta

_{[ 1981 ],}

_{pp. 110-111}et J.C. Deville

_[1982],

pp.

68-74).

Dans ce cas en

effet,

les

équations

(2’)

et

_(5’)

sont les

_équations

de

_l’analyse

des

correspondances

de l’ensemble des indicatrices des modalités d’états

multipliées

par les mesures des intervalles

_tif.

Les

codages

réels

ak sont

donc les

vecteurs _{propres de}

_l’analyse

des

_{correspondances}

du tableau

_disjonctif

à n

_lignes

_(nombre

d’individus)

et _mpcolonnes

_(produit

du nombre d’états _parle nombre d’intervalles de stabilité

du

_processus),

dont la case élémentaire vaut 1 si l’individu est dans cet état durant cet intervalle

de

_temps

et 0 sinon. Mais un tel tableau

_peut

rarement être soumis à

l’analyse,

à cause de sa taille et de sa structure très «clairsemée» due au fait que les

changements

individuels d’état ne

sont _pas,en

_général,

synchronisés.

Par

exemple,

l’observation sur 600 individus de 3

changements

d’état en _{moyenne d’une variable à 5 modalités}

engendre

un tableau

_disjonctif

pondéré

de 600

_lignes

et 9000

colonnes,

avec seulement un

_cinquième

des cases non

_{nulles ;}

il

est _{clair que}son

_analyse

ne donnera pas de résultat

typologique

intéressant,

chaque

individu formant à lui seul un

_type.

La solution

_pratique

_{consiste à diviser l’intervalle d’observation du processus}en un

nombre raisonnable d’intervalles

_(de

durées constantes ou

_non),

sans tenir

_compte

des

changements

individuels d’état. Le tableau de

_fréquence

est ensuite construit en calculant la

proportion

de

_temps

_passé

_{par les individus dans chacun des états}

_possibles

des variables au cours de

_chaque

intervalle de

_recodage

(voir

ci-dessous la définition de la densité individuelle de

séjour

dans les

états).

Ce tableau est soumis à

_l’analyse

des

_{correspondances}

et les résultats

s’interprètent

avec les

techniques

habituelles. Il faut

souligner

_quecette

_analyse,

si elle conserve

intégralement

l’information sur les durées de

présence

des individus dans les

états,

_perd

en

revanche,

en cumulant les

_temps

de

_séjour

au sein des intervalles de

_recodage,

l’ordre de

passage dans les états et les retours éventuels

lorsque

ces

_changements

interviennent dans un

même intervalle.

Il existe diverses

_{possibilités}

_pourle

_découpage

de la

_période

d’observation et le calcul des

fréquences.

Lors de la division de l’intervalle

_{en p intervalles}

de

_longueurs

_égales

ou non

_(notons

2

cette

_partition),

le choix des

_tk

doit

_s’appuyer

à

la

_fois,

comme nous le verrons _parla

suite,

sur la connaissance

_préalable

_{du processus}

(arguments

propres à la

discipline qui

l’étudie),

et sur l’étude de la distribution des

_changements

d’état des individus dans le

_temps

_(arguments

_{statistiques).}

Une fois choisie la

_partition

du

temps,

le

_codage

_{scalaire du processus recherché}

_{(Y(i, j,k),}

_jex,

_{kE 1),}

est une fonction à

valeur réelle définie sur le

produit

cartésien Notant le

_temps

de

séjour

de l’individu i dans

_{l’état j}

au cours de l’intervalle Deville et

_{Saporta [ 1980]}

donnent à

Y(i, j, k)

la valeur c’est-à-dire la

_proportion

du

_temps

total d’observation _{du processus}

(Tj

que l’individu i a

_passé

dans

l’état j

durant l’intervalle de

_temps

_quenous

appellerons

aussi la densité de

_présence

de l’individu dans l’état. Dans ce _cas,

_quelle

_{que soit}la

partition

de la

_métrique

sur le

_temps

est uniforme et la somme de

chaque

ligne

du tableau

vaut 1

₍₁₀₀

% du

_temps

d’observation de

_{l’individu).}

_{L’interprétation}

du tableau est alors

exactement celle d’une table de

_contingence

_qui

distribue la densité de

_présence

des individus entre les états et les intervalles de

_temps.

Cependant,

du

_point

de vue du calcul

algébrique

effectué lors de

_l’analyse

_factorielle,

rien

n’oblige

à ce _queles intervalles de

codage

soient de même durée ou _{que la}

_métrique

sur le

_temps

soit

uniforme,

bien au contraire. D’une

_part

plusieurs

_arguments

statistiques

militent en faveur

(10)

d’un

_{découpage plus}

détaillé dans les

_périodes

où les

_changements

d’état sont nombreux et

_plus

relâché

_lorsqu’ils

sont rares

(voir

Deville

[1982]

et Florette

[1988]).

D’autre

part,

du

point

de

vue de la

problématique qui

va nous _{occuper dans la suite}

(la

stratégie

résidentielle des

individus),

il est naturel de s’intéresser

_plus

_{spécialement}

aux

changements

de résidence

_qui

surviennent à

_l’âge

adulte

_{(plus particulièrement}

la

_période

de

_plus

forte

_mobilité,

15-35 ans _par

exemple),

dont la décision revient

_{généralement}

à

_{l’individu,}

_{plutôt qu’aux}

_changements

de résidence durant l’enfance ou la

vieillesse,

plus

souvent _{décidés par des tiers. On}

_peut

alors avoir intérêt à faire varier la

_métrique

dans différents

_segments

de la

_période

d’observation.

Ainsi,

on

_adopte

souvent la solution

_qui

consiste à calculer la densité de

_présence

des

individus dans les états par

rapport

à la durée de

chaque

intervalle de

_{temps :}

proportion

de la durée de l’intervalle _{que l’individu}i a

passé

dans

_{l’état j.}

Dans ce cas la somme d’une

_ligne

du tableau vaut _p,le nombre d’intervalles définis dans et si les intervalles sont de

_longueur

_variable,

la

_métrique

sur le

temps

n’est

_plus

uniforme. C’est cette _{méthode que}nous avons

appliquée

aux données de

l’enquête

de

_Bogota.

Les

_{algorithmes correspondant}

à l’ensemble des

_techniques

_présentées

dans cette section ont été

_programmés

sous SAS.

2.

L’ENQUÊTE

ET L’APPLICATION DE

_L’AHQ

2.1. La collecte des données

Contexte et

_{problématique}

L’enquête

et

_l’analyse

_statistique

_présentées

ici s’inscrivent dans une recherche

entreprise depuis

août 1992 _parune

équipe

de chercheurs du C.E.D.E.

(Centro

de Estudios sobre el Desarollo

Econômico,

de l’Université des Andes -

_Colombie)

et de

l’ I . R. D .4

sur la mobilité des

populations

de

_Bogota

et son

impact

sur la

_dynamique

de l’aire

_{métropolitaine.}

Parallèlement à

ce _programmes’est

développé depuis

février 1994 un _programmede recherche en

_coopération

entre l’I.R.D. et le

_département

de

_{mathématiques}

et

_statistique

de l’Université Nationale de

Colombie sur les méthodes

_{d’analyse statistique}

des données

biographiques5.

Bogota

est la

_métropole

latino-américaine

_qui

a connu la croissance

_{démographique}

la

_plus

rapide

durant les années

_cinquante

et soixante

_(plus

de 6 % _par

_an).

Entre 1951 et 1964 la ville a

doublé sa

_population

et en 1970 elle

comptait

2,5

millions d’habitants.

_Depuis

une

_vingtaine

d’années,

le

_rythme

de croissance de la

_capitale

_colombienne,

comme celui des autres

métropoles

du

sous-continent,

s’est ralenti : il était d’environ

_2,5

% annuel lors du dernier

recensement en 1985. Au moment de

_l’enquête

C.E.D.E./O.R.S.T.O.M.

_{(octobre 1993),}

Bogota

compte

près

de

5,5

millions d’habitants et croît

_toujours

à un

rythme

légèrement

supérieur

à 2 % _paran. Ce ralentissement de la croissance

s’explique

_{par les effets}

conjugués

de

trois

_{phénomènes :}

la réduction du

_rythme

d’accroissement naturel due à la baisse

_rapide

de la

fécondité,

une diminution des flux

migratoires

à destination de

_Bogota

_proprement

dit et la transformation du schéma

_{géographique}

de la croissance au

profit

des

_{municipalités}

périphériques

de l’aire

_{métropolitaine.}

L’évolution

_{démographique}

récente de la ville

s’accompagne

de nouvelles

_stratégies

de localisation résidentielle des habitants

_qui

_produisent

des

_{changements rapides}

et

_importants

dans la

_répartition

de la

_population

et les formes de

ségrégation

sociale au sein de

l’agglomération.

Ce sont ces

recompositions,

mal mesurées et _peu étudiées

_{jusqu’à présent,}

_qui

sont au centre de la

_thématique

de

_{l’enquête.}

4 Équipe

dirigée par

Françoise

Dureau _(I.R.D.)et Carmen Elisa Florez (C.E.D.E.).

(11)

Population

soumise à

_l’enquête

L’unité _{d’observation pour}

_l’enquête

est le

_ménage,

défini comme le groupe de _personnes

qui

occupe tout ou

partie

d’un

logement

et

partage

les repas. La

population

des

ménages

inclut les résidents habituels

_(personnes

vivant la

_{majeure partie}

du

_temps

dans le

_ménage

même si elles se

sont absentées au moment de

_l’enquête

_pourune

_période

courte -

_depuis

moins de trois

mois)

et

les résidents non habituels

_(personnes

qui

vivent la

majorité

du

_temps

hors du

ménage

mais ont habité au moins 30

jours

- consécutifs ou non - dans le

ménage

enquêté

au cours de l’année

écoulée,

que ces _{personnes soient}ou non

présentes

au moment _{du passage de}

_{l’enquêteur).}

Ainsi,

s’ils accumulent la durée de

_présence

nécessaire,

les individus suivants seront considérés comme faisant

partie

du

ménage :

militaires du

contingent,

élèves internes ou travailleurs

exerçant

leur activité hors du

ménage

ou de

_Bogota

qui

reviennent

régulièrement

ou

périodiquement

dans leurs

_foyers,

personnes

emprisonnées

ou

_{hospitalisées}

_{pour des}

_temps

courts,

employés-domestiques

ou autres salariés

_lorsqu’ils

dorment dans le

_logement,

personnes de passage

(invitées)

ou en

pension.

En

revanche,

les personnes

qui

louent une ou

plusieurs

pièces

du

_logement

et cuisinent

_séparément

_{(«inquilinos»),}

forment des

_ménages

différents.

Échantillonnage

Pour des raisons de

coût,

le

_plan

de

_{sondage adopté}

ne vise pas la

représentativité

de l’ensemble de l’aire

_{métropolitaine}

de

_Bogota

mais seulement l’observation fiable de 11 domaines d’études

₍₄

communes ou

_parties

de communes de l’aire

métropo-litaine et 7

_quartiers

de

_Bogota),

ces zones

_ayant

été choisies a

priori

comme

_ayant

une valeur

heuristique

pour la

problématique

du programme

(Figure

1).

Dans

chacun des 11 domaines

préala-blement

stratifiés,

le

_plan

d’échantillonnage

consiste en un

sondage

aréolaire à trois

_degrés

avec

probabilités

_inégales

de sélection des unités

_primaires

(U.P.).

Au

_{premier degré}

les aires sélectionnées dans

_chaque

strate sont des «manzanas»

_(pâtés

de

_maison),

unités

_spatiales

_que définissent le réseau de voirie et

les limites naturelles ou autres :

rivières,

«quebradas»

(fossés),

clôtures etc. On assure une bonne

répartition

géographique

de

l’échantillon en sélectionnant les

U.P. au _{moyen d’une}

_grille

de

points

dont la taille de la maille

est fonction du taux de

_sondage

dans la strate

_{(tirage spatial}

(12)

matique) ;

la

_probabilité

de sélection de

_chaque

U.P. est donc

_{proportionnelle}

à sa

_superficie.

Au

second

_degré,

_après

avoir établi la liste

_complète

des

_logements

du

_pâté

de

maison,

on sélectionne dans

_chaque

U.P.

_cinq

_logements

_(unités

secondaires)

par

tirage

systématique

équiprobable

dans la liste. Enfin au troisième

_degré,

les unités d’observation sont tous les

ménages

des

_logements

sélectionnés.

Questionnaire

Le

_{questionnaire}

de

_l’enquête

_comprend

un formulaire d’information

socio-démographique

couvrant l’ensemble des individus des

_ménages

sélectionnés

₍₁₀₃₁

_ménages),

ainsi

_qu’une

série

de modules visant à

recueillir,

sous forme de

calendriers,

des données

rétrospectives

sur la

biographie

résidentielle,

professionnelle

et familiale d’un sous échantillon de la

_population

des

ménages

appelé

"sous-échantillon

_{biographique".}

L’échantillon

_auquel

est soumis la

_partie

biographique

du

_{questionnaire}

est

_composé

d’un individu de

_plus

de 18 ans _par

_ménage

_enquêté

(1031 individus)

et, sa _{structure, contrôlée par des}

_quotas

de sexe,

d’âge,

de relation de

parenté

avec le chef de

_ménage

et de statut

_migratoire.

Les conclusions de

_l’analyse

n’ont donc de

_portée

qu’à

l’intérieur de cet

_univers,

_pourcette

_{population particulière,}

et non _{pour l’ensemble de}la

population

de

_Bogota

et son aire

métropolitaine6.

Variables soumises à

_l’analyse

Visant en

_premier

lieu une

typologie

des

trajectoires

résidentielles en

_ville,

_l’analyse

se base sur

la variable d’état construite à

_partir

de l’observation des localisations dans l’aire

_{métropolitaine}

de l’ensemble des résidences de

_plus

d’un an connues _{par les individus}

_(variable

active)’.

Le niveau

_{d’agrégation géographique}

de la variable doit fournir la

_précision

maximum dans

l’analyse

de la mobilité

_spatiale

intra-urbaine tout en conservant des effectifs suffisants dans

chaque

modalité. La nomenclature

_{géographique}

_qui

convient le mieux à cet

_objectif

est celle des "alcadias menores" de

_{Bogota :}

_{19 unités que}nous

_appellerons

désormais arrondissements.

À

ces

modalités,

_qui

décrivent les résidences à l’intérieur de la

ville,

_s’ajoute

une modalité _{pour les}

lieux de

_Bogota

non

spécifiés,

_quatre

modalités pour les

_quatre

zones d’étude de la

périphérie

de

l’aire

_{métropolitaine}

_(communes

de

Chia, Tabio,

Madrid et

_Soacha),

une modalité _{pour les}

autres communes de l’aire

métropolitaine (autres

mun.

a.m.)

et enfin une modalité _{pour les} résidences situées hors de l’aire

_{métropolitaine.}

Au

_total,

les individus

_peuvent

donc se trouver

dans 26 modalités d’état.

Pour mettre à

_jour

les relations existant entre les

_types

de mobilité résidentielle et les autres

composantes

de la

_biographie,

nous introduisons 7 variables

_{longitudinales}

illustratives

_qui

résument des

_{«chapitres»}

de la

_biographie

_quel’on

_peut

_supposerêtre déterminés et/ou

déterminants par

rapport

à la

trajectoire

spatiale :

relation de

parenté

avec le chef de

_ménage,

statut

_matrimonial,

co-résidence avec les

_enfants,

_composition

du

_ménage,

accès au

_logement,

carrière d’éducation et mobilité

_{professionnelle. Chaque}

variable

_ayant

son calendrier propre, le nombre

_d’étapes

_{vécues par les individus de}l’échantillon est _{donc différent pour chacune}

d’elles,

et

_indépendant

du nombre

_d’étapes

résidentielles.

Enfin une caractérisation

_{socio-économique}

des individus

pratiquant chaque

_type

de mobilité et des

_ménages

_auxquels

ils

_{appartiennent}

sera obtenue

_grâce

à un second ensemble de

variables illustratives

transversales,

caractéristiques

individuelles et collectives à la date de

l’enquête.

On

_reprend

dans ce bloc de

variables,

les

descripteurs

socio-démographiques

6 A _{propos du contrôle des}_quotas,voir aussi le

_premier

_paragraphede la troisième _{partie ;}le lecteur intéressé par des informations _plusdétaillées sur la _{méthodologie}de _l’enquêteet la

_{représentativité}

des résultats _peutconsulter

Dureau, Florez,

Barbary,

Garcia, Hoyos [ 1994] et Dureau et Florez _{[ 1996].}

’

(13)

classiques

des individus -

sexe,

_âge,

statut

_migratoire,

niveau

d’instruction,

catégorie

socioprofessionnelle

etc., des

_ménages

- taille du

ménage,

caractéristiques

du

_logement

(taille,

statut

_{d’occupation,}

indice de

_{promiscuité)}

et du chef de

_ménage

-

sexe,

_âge,

statut

_migratoire,

âge

moyen des enfants.

2.2. Les

_étapes

d’exécution de

_{l’AHQ jusqu’à}

la classification des

_trajectoires

Le _tempsde

_{l’analyse :}

_période

_d’analyse,

données

censurées,

discrétisation

L’analyse

des données

_présentées

dans la section

_précédente

va être menée selon ce

_qu’on

_peut

appeler

le

_temps

_biographique

individuel,

c’est-à-dire en suivant les individus

_depuis

leur naissance

_jusqu’à

_l’âge

atteint à la date de

_{l’enquête.}

D’autres

_options

sont

_possibles,

on

pourrait

par

exemple

mener

_l’analyse

en

_temps

historique (en

suivant les individus entre deux

dates)

ou encore selon une

horloge

démarrant à un événement autre _quela

naissance,

mais le

choix du

_temps

_{biographique correspond}

à une orientation

problématique

déterminée. Il

_permet

en effet de mettre en

relation,

au niveau individuel et au niveau

_statistique

dans l’ensemble de l’échantillon ou dans chacune des classes de la

typologie,

les différents itinéraires

résidentiels,

familiaux,

éducatifs ou

professionnels,

_{pour que}

s’exprime

la cohérence des

stratégies

individuelles et collectives.

_L’option

du

_temps

_biographique

étant

_prise,

il

_faut,

_{pour coder les}

données,

choisir une

_période

de

_temps

commune à tous les individus

_quel

_{que soit leur}

_âge

à la

date de

_{l’enquête.}

Si l’on souhaite conserver la totalité des

étapes

vécues,

c’est

l’âge

atteint à la

date de

_l’enquête

_{par l’individu le}

_plus

vieux

₍₉₂

ans dans notre

_cas)

_qui

fixe l’étendue de la

période.

Afin _{d’éviter que}la

_partie

finale du _{tableau soit presque totalement vide}

_(«censure

à

droite»,

voir

_{Figure 2),}

on

préfère

arrêter

l’analyse

à 65 ans _pourla variable active et 70 ans

pour les variables

illustratives,

sauf la carrière éducative

arrêtée, celle-ci,

dès 45 ans.

Les individus

_n’ayant

_{pas atteint}ces

_âges

sortent

_{d’observation,}

donc des modalités

prévues

pour les variables

longitudinales,

à

partir

de leur

âge

à la date de

l’enquête (phénomène

appelé

"censure à droite" dans le

_jargon

de

_l’analyse

_{longitudinale).}

On note au _{passage que}le

type

de censure _{que l’on}doit

prendre

en

_compte

_dépend

du

_type

de

_temps

choisi pour

_{l’analyse :}

avec un

_temps

_historique

_par

exemple,

les données seraient censurées à

gauche

_{pour les}

individus n’étant pas encore nés à une date donnée. La solution retenue _pourcette

_première

analyse

sur l’ensemble de l’échantillon est

_l’ajout

d’une modalité

_{supplémentaire}

à chacune des variables

_{longitudinales}

dans

_laquelle

l’individu entre dès

_qu’il

est censuré. Ainsi l’ensemble des

individus de l’échantillon est

_"présent"

dans une modalité d’état tout au

long

de la

_période

d’analyse (de

0 à 65

ans).

Ce choix

_peut

être

_critiqué

_puisque

la durée de

_"présence"

dans la

modalité de censure influence le résultat

_{typologique :}

dans le cas du

_temps

_biographique

individuel et de la censure à

droite,

cet effet se

_ramène,

comme on le verra, à un effet

_{d’âge (la}

structure _par

_âge

des classes étant nécessairement

_homogène).

On

_peut

limiter cet effet en traitant

les modalités de censure en

supplémentaire

dans l’AFC ou en réalisant des

analyses séparées

pour différentes cohortes d’individus. Nous n’avons retenu aucune de ces solutions car nous

cherchons une

_{typologie globale}

de la

mobilité,

_{pour l’ensemble de l’échantillon}et

_prenant

en

compte

l’ensemble de la

_trajectoire

résidentielle. Dans cette

_perspective

l’effet

_d’âge

nous

_paraît

au contraire devoir être conservé : un individu de 20 ans ne

_peut

_pas

_appartenir

à la même classe

qu’un

individu de 50 ans

(c’est-à-dire

avoir la même

_trajectoire

au même

_âge

sur l’ensemble de

la

_{période d’analyse).}

Comme on l’a dit en

_présentant

la

méthode,

la mise en oeuvre de

l’AHQ

_reposesur un

découpage

de la

_{période d’analyse}

en un nombre "raisonnable" d’intervalles de

_recodage.

Nous avons d’abord testé un

découpage

uniforme de la

périodes

0-65 ans en

_segments

quinquennaux,

les

_fréquences

étant calculées en

_proportion

du total de la

_période

_analysée.

Cette

_analyse

fournit des grosses classes d’individus

jeunes

dont les

_trajectoires

sont _peu

_homogènes

_{et, à}

_l’inverse,

(14)

des

_changements

d’état selon

_l’âge

des individus

_(Figure

₂₎

_permet

de définir un

_découpage,

mieux

_adapté

aux

données,

en 15

périodes d’amplitude

variable

correspondant

à peu

près

aux

quantiles

de la distribution. La

_précision

est bonne entre 13 et 25 ans, elle diminue avant et

après.

La même démarche a été

appliquée

aux variables

longitudinales

illustratives. Pour l’ensemble des

variables,

les

_fréquences

sont calculées en

_proportion

de la durée de

_chaque

intervalle de

_recodage.

Le tableau soumis à l’AFC

_comprend

1031

_lignes,

398 colonnes actives

(15

x 27 moins 7 colonnes

_vides)

et 625 colonnes illustratives.

Figure

2 : Distribution des

_changements

de résidence

_(RESIALC)

selon

_l’âge

Pondération de l’échantillon

Compte

tenu _{du fait que le}

_plan

de

_sondage

_{n’est pas}

_auto-pondér

et _{que le sous-échantillon}

biographique

n’est _pas

_probabiliste

_(méthode

des

_quotas),

le

_problème

se _posede savoir si

l’analyse

factorielle doit être faite sur les données

_pondérées

_{par les facteurs}

_{d’extrapolation}

(inverse

de la

_probabilité

de sélection des

_ménages).

Les deux AFC

_(pondérée

ou

_non)

donnent

des résultats tout à fait semblables en ce

qui

concerne

_{l’interprétation}

des facteurs de

_plus

haut rang

(dix

premiers

facteurs

équivalents,

à

quelques

inversions

près).

Cependant

lors de la classification dans

_l’espace

des

_premiers

facteurs,

la

_pondération

a _{pour effet}de rendre très "volatiles" les individus

_enquêtés

à

Chia,

Madrid et Tabio

_(trois

communes à faible

_population),

alors que l’inertie des individus des autres domaines

d’étude,

beaucoup

plus peuplés,

est au contraire très forte. Dans cette

_étape

de mise à

_plat

des différents

_types

_{d’itinéraires,}

nous

préférons

que tous les individus soient à

_égalité

_(AFC

non

_pondérée).

En

_revanche,

lors de la

phase

de

_description

et caractérisation des

classes,

il nous a semblé

_important

de tenir

_compte

du

poids

démographique

(même

approximatif)

de

_chaque

_type

de

mobilité ;

nous avons donc

(15)

Analyse

factorielle

L’analyse

des

_{correspondances}

(CORRESP

de SAS ou CORBI de

_SPADN)

fournit un

histogramme

de valeurs _{propres très}

_{plat (Figure}

3),

ce

_qui

ne

surprend

_{pas étant donné}la

structure du tableau :

_grand

nombre de colonnes au

_regard

du nombre de

_lignes

et abondance de colonnes presque vides.

Rappelons

ici que le

recodage adopté,

s’il conserve la totalité des durées de

_séjour

des individus dans les

états,

_perd

en revanche l’ordre

_{chronologique}

des

_étapes

puisque

toute

_permutation

des colonnes est _{indifférente pour le résultat de l’AFC. D’autre}

_part

deux individus

_ayant

des itinéraires strictement semblables mais

_simplement

décalés d’une ou

deux

_années,

sont très

_éloignés

sur les

plans

factoriels. Le tableau

analysé

est donc très "bruité"

par

rapport

à la structure de

_proximité

_qui

nous

_intéresse,

_"bruitage"

_quel’on retrouve dans

l’allure de

_{l’histogramme}

_{des valeurs propres.}

Figure

3 :

_Histogramme

des dix

_premières

_{valeurs propres de l’AFC}

_(tableau

1031 x

₃₉₈₎

(16)

Malgré

cela,

l’interprétation

des

_premiers

facteurs est aisée et même si la

_chronologie

est

formellement

_perdue

lors du

_codage,

cette méta-information structure si fortement les données

qu’elle

ressort sur tous les axes factoriels utiles. Le

_plan

1 x 2

(Figure 4)

montre le

_type

de

structure mise en évidence par les

premiers

axes : les

séquences

de variables concernant un

même lieu de résidence sont

_regroupées,

ordonnées

_{chronologiquement}

le

_long

des axes, elles

correspondent

à des sous-ensembles d’individus minoritaires mais très stables dans ces lieux :

dans le cas des deux

premiers

facteurs,

trois groupes

_ayant

vécu toute leur vie

respectivement

à

Tabio

_(A22),

Chia

_(A21)

et Madrid

_(A23).

Pour

_compléter

la démarche

_{classique d’interprétation}

de

_l’AFC,

on

_peut

projeter

sur les

_plans

les variables illustratives

longitudinales

et faire

apparaître

les

_{points représentant}

les centres de

_gravité

des

_{caractéristiques}

transversales. A

partir

des

_premiers

facteurs de

_l’analyse,

on

_parvient

ainsi sans difficulté à identifier et

caractériser _{l’ensemble des groupes stables. Ces individus}

_{représentent}

à peu

près

22 % de

l’échantillon et environ 52 % de l’inertie

_expliquée

_parles 10

_premiers

facteurs ;

ces

_facteurs,

dont

_{l’interprétation}

est

_claire,

totalisent 25 % _{de l’inertie totale du nuage. Les schémas}de

mobilité

_qui

caractérisent le reste des individus

₍₇₈

% de

_{l’échantillon)}

sont moins faciles à

mettre en évidence à

partir

de la seule

interprétation

des facteurs. Ce

qui

caractérise les axes, ce

sont des associations entre modalités

_{qui témoignent}

de transitions

_fréquentes,

à certains

_âges,

entre les lieux

_qu’elles

_{représentent.}

Nous n’avons

_plus,

comme _pourles individus

_stables,

d’axes _{entièrement déterminés par}un ou deux groupes aux

trajectoires

semblables,

mais

seulement la mise en évidence de _groupes

_ayant

en commun une transition donnée à un

_âge

donné mais dont le reste de la

_trajectoire

_peut

différer. Ces

résultats,

typiques

de

_{l’application}

de

l’analyse harmonique

qualitative

aux données de calendriers

(voir

Deville

[ 1982],

Béret

[1988]

et

_Degenne,

Lebeaux et Mounier

_[1995]),

restent insuffisants du

_point

de vue de notre

_objectif

typologique.

Classification

du _nuagedes individus

Pour

_parvenir

à une

_{typologie complète}

des

trajectoires,

nous avons

procédé

à une classification

des individus dans

_l’espace

vectoriel des

_premiers

facteurs de

_l’analyse

des

_{correspondances 8 .}

Après plusieurs

essais,

en faisant varier le nombre de facteurs de 7 à 15 et en

_explorant

les

partitions jusqu’à

30 classes et

_plus,

on constate _que

_jusqu’à

10 facteurs la

_typologie

_gagneen

précision.

A

_partir

du onzième

facteur,

la taille de la classe la

_{plus importante}

_augmente,

même

si l’on considère des

_partitions

_comprenant

un

_grand

nombre de classes dont

_beaucoup

ont _par

conséquent

des effectifs

_trop

faibles. Sur cette base

_empirique,

nous avons retenu

_l’espace

vectoriel constitué par les dix

premiers

facteurs de

_l’AFC,

_quenous considérons comme le sous-espace conservant l’information utile

₍₂₅

% de l’inertie totale du

_nuage).

La _part

considérable du "bruit" dans l’information

_{originale (75}

%)

s’explique

par le fait que les 27 modalités d’état croisées avec les 15 intervalles de

_temps

produisent

un tableau très clairsemé

dont une

grande

_part

de la

variabilité,

qui provient

des

petits

décalages

temporels

entre

trajectoires

équivalentes,

n’est pas

interprétable.

Le _{nuage des individus}dans cet _espaceest

ensuite soumis à des

_algorithmes

de classification ascendante

_{hiérarchique}

ou

_{semi-hiérarchique}

(CLUSTER -

critère de Ward sous

SAS,

SEMIS de

_{SPADN) ;}

les deux

_procédures

donnent

des résultats très

_proches

et nous avons conservés ceux de SPADN

qui présentent l’avantage

d’optimiser

la

_partition

une fois choisi le nombre de classes

(Figure

5)9.

La

_partition

en 15 classes constitue la

_typologie

_quenous allons décrire. Elle est obtenue

après

coupure de l’arbre de classification et

_optimisation

_{par affectation des individus à}la classe

dont le centre de

_gravité

est le

_{plus proche}

_(PARTI

de

_SPADN).

_Après

cette maximisation de

8

La même démarche est _appliquée_par_Degenne,Lebeaux et Mounier [1995] aux données sur l’insertion professionnelle des _jeunesen France.

9

Rappelons qu’une partition en un nombre donné de classes, issue d’un arbre de classification ascendante hiérarchique, n’est pas optimale au sens du critère de la maximisation de l’inertie inter-classe.

(17)

l’inertie

inter-classe,

la

_partition

_explique

82 % _{de l’inertie totale du nuage dans}

_l’espace

des dix

premiers

facteurs,

ce

qui

montre _{que la démarche}

prend

correctement en

_compte,

hors le

"bruit",

l’information

_{significative}

_{fournie par}

_{l’enquête.}

Figure

5 : Arbre de classification dans

_l’espace

des dix

_premiers

facteurs de l’AFC

Caractérisation et

_{interprétation}

du résultat

_typologique

Le caractère

_longitudinal

des données

_impose

_l’emploi

de

_techniques

_{particulières}

_pour caractériser et

_interpréter

la

_{typologie. Classiquement}

en

analyse

typologique,

les coordonnées

des centres de classes sur les facteurs et les valeurs tests

_associées,

ainsi _queles individus les

plus

proches

du centre de

_chaque

classe,

fournissent la base d’une

_{interprétation}

"indirecte" des

classes à

_partir

des facteurs. Pour décrire une

typologie

de

trajectoire,

il est à la fois

_plus

_direct,

plus

précis

et

_plus

riche de revenir à la donnée

_originale

codée. En affectant sa classe

d’appartenance

à

_chaque

individu et en calculant les

_fréquences

de

séjour

_moyennesdes individus de la classe dans les modalités d’état au cours de

chaque

intervalle de

codage,

on obtient le

_profil

de mobilité de la classe _quel’on

_peut

traduire

_{graphiquement}

_(Figures

9 à 23 en

annexe).

La même

_technique

fournit les

_profils

des classes

_{correspondant}

à chacune des

variables

_{longitudinales}

illustratives

_(Figures

6 à

_8).

Tous ces

_profils

_peuvent

être

_comparés

entre eux ainsi

_qu’au

_profil

d’ensemble de

l’échantillon’°.

Enfin,

on

_peut

éditer la série de tableaux croisés

_qui

mettent en relation la

_typologie

avec chacune des

_{caractéristiques}

transversales des individus et des

_ménages

retenues comme

illustratives ;

le

_pouvoir

_{"explicatif’}

de

_{chaque caractéristique}

transversale

_peut

être _{résumé par la}

_statistique

du

x2

associée au

tableau et l’on

_structure

le commentaire en

_repérant

les cellules du tableau

_ayant

les contributions

les

_plus

fortes au X

global.

A

_partir

de l’ensemble de ce

matériel,

on

_{peut donc,}

_pour

_chaque

_classe,

décrire le

comportement

résidentiel des

enquêtés

et

_dégager

leur

_{trajectoire spatiale spécifique.}

Cette

trajectoire

est mise en relation avec la succession des événements du

_cycle

de vie que

_permettent

d’appréhender

les variables

_{longitudinales}

illustratives. On

_{signale également}

les

_{caractéristiques}

démographiques

et

_{socio-économiques qui}

_complètent

la "carte d’identité" de la classe. Des

’°

Pour _permettreces _{comparaisons,}il faut éliminer l’effet des structures _par_âge,différentes dans _chaque_classe, effet directement lisible dans _{l’importance prise}par la modalité de censure à droite au fur et à mesure _{que l’on} progresse dans l’âge. Pour ce faire on calculera les _fréquences_parmodalité d’état pour _{chaque âge}sur l’ensemble

des individus de la classe _ayantatteint cet _âge_(i.e.hors individus _{censurés) ;}le total de

_chaque

colonne est ainsi normalisé à 100%.