• Aucun résultat trouvé

Échantillonnage des communes de plus de 10 000 habitants

Chapitre 2 : Les fonctionnalités des supports d'enquêtes

2.3 Les supports spatiaux et l’échantillonnage du recensement rénové de la

2.3.2 Échantillonnage des communes de plus de 10 000 habitants

Pour les communes de plus de 10 000 habitants la méthode de sondage est plus sophistiquée. Il est espéré enquêter 40 % de la population des ménages en cinq ans, mais ce chiffre est un peu incertain du fait que la base de sondage utilisée est un répertoire d'adresses des logements.

L'Insee se sert d'une base de sondage sur les logements (le RIL – répertoire d'immeubles localisés) pour tirer au sort 8 % d'échantillons d'adresses chaque année. Pour chaque commune, la base de sondage est divisée en strates géographiques, et en strates non- géographiques à l'intérieur de chaque strate spatiale. Les strates géographiques correspondent à des secteurs de tirage, et les strates non géographiques à des typologies de nombres de logement par adresse (illustration 1859). Nous reprenons longuement la documentation de

l'Insee afin d'expliquer l'utilisation des différents supports géographiques et comprendre les méthodes de construction des poids de sondage des observations du recensement rénové.

59 Insee, le nouveau mode de recensement: élaboration à travers les tests [en ligne] (Consultée le 14/06/2016) <http://www.insee.fr/fr/ppp/sommaire/imeths01e.pdf>

Illustration 18: Exemple des groupes de tirage des adresses des communes de 10 000 habitants et plus ( source : Insee, le nouveau mode de recensement: élaboration à travers les tests ,p.5)

« Ce schéma représente les voies d'un quartier quelconque d'une commune de grande taille. Les petits carrés représentent les adresses d'habitation le long des voies. Chaque adresse a été affectée à un groupe identifié par sa couleur. Il y a cinq groupes au total dans la commune et tous ont le même nombre de logements. Ces groupes sont stables dans le temps et sont mis à jour uniquement en fonction des créations et des destructions d’adresses. Une adresse qui a été placée dans un groupe y demeure, du moins jusqu’à sa disparition. On décide, par exemple, que l'échantillon des adresses recensées en 2005 sera tiré dans le groupe « rouge » et celui des adresses recensées en 2006 dans le groupe « jaune ». Dans ces conditions, le groupe d'adresses "rouge" fera l'objet d'un nouveau tirage d'échantillon en 2010, puis 2015, puis 2020, etc., tandis que le groupe "jaune" sera concerné en 2011, puis 2016, puis 2021, etc. » (Insee, le nouveau mode de recensement: élaboration à travers les tests, p.5)

Les groupes de rotations sont construits afin qu'ils contiennent des adresses réparties de manière homogène dans l'espace. Aussi ils sont construits pour regrouper des adresses de tailles différentes afin d'éviter le phénomène de grappe. Nous présentons successivement les deux strates de tirage.

-la strate des adresses :

Les unités d’échantillonnage sont des adresses d'habitation et non des logements. Dans le recensement, l'Insee considère qu'un ménage est l'ensemble des individus résidant dans un même logement. Échantillonner à partir des adresses pose problème, puisqu'une adresse est associée dans bien des cas à plusieurs logements. Le nombre de logements peut même être considérable pour les grands ensembles collectifs. Les résultats du tirage au sort vont être biaisés par ces grandes adresses qui auront une influence plus importante qu'une adresse avec peu de logements associés. L'Insee remarque que les profils socio- démographiques des logements collectifs sont souvent similaires ; une adresse composée de beaucoup de logements biaisera alors fortement les résultats. Ce problème est appelé « effet de grappes ». Le choix de considérer les adresses comme unités d'échantillonnage est donc non optimal. Il provient de la réponse élaborée pour répondre à un problème amont. Il a été choisi de demander aux enquêteurs d'enquêter toutes les habitations d'une même adresse, car il était plus difficile de déterminer précisément les logements au sein des adresses. L'Insee ne souhaite pas tirer au sort des logements dans des adresses qui seraient difficilement accessibles par les enquêteurs. Cela serait source d'erreur. Il n'existe pas de base de données

déterminant aux sein des immeubles les numéros des logements. Seul l’enquêteur une fois sur place peut dénombrer les logements. C'est donc pour répondre à ce problème de manque de données qu'il a été imposé de choisir les adresses comme unité d’échantillonnage.

- « Les groupes de rotation sont constitués en trois strates caractérisées par le nombre de logements des adresses.

– les adresses de grande taille d'une commune sont celles qui, à la fois, sont les plus grandes en nombre de logements, ont au moins 60 logements chacune et qui, réunies, cumulent au maximum 10% des logements de la commune. Elles constituent la première catégorie. Elles sont réparties en cinq groupes pour être enquêtées exhaustivement en cinq ans ;

– les adresses nouvelles sont les adresses qui apparaissent année après année. Celles qui sont de grande taille rejoignent la catégorie précédente. Les autres constituent la deuxième catégorie ;

- les autres adresses d'habitation regroupent toutes les autres adresses où il existe au moins un logement. Elles constituent la troisième catégorie. Les adresses nouvelles qui forment la deuxième catégorie sont réparties entre les groupes de la troisième catégorie de manière à être toutes recensées en cinq ans. Pour les mêmes raisons qui ont conduit à équilibrer les cinq groupes de communes de moins de 10 000 habitants, mais cette fois en raisonnant au niveau de la commune et non plus au niveau de la région, chaque groupe d'adresses doit être aussi représentatif que possible de l'ensemble de sa catégorie dans la commune et chaque échantillon d'adresses doit être aussi représentatif que possible de l'ensemble des adresses de la commune. Les critères retenus sont les mêmes que pour l'équilibrage des groupes de communes de moins de 10 000 habitants : nombre de logements individuels, nombre de logements collectifs, population par sexe et âge (la référence étant le recensement de 1999 à l’initialisation du répertoire). » (Insee, le nouveau mode de recensement: élaboration à travers les tests, p.10)

Afin d'éviter les effets de grappe concernant les grandes adresses il est choisi de toutes les enquêter en cinq ans. Ces adresses sont réparties en cinq groupes équilibrés (en nombre de logements) en cherchant à optimiser la répartition spatiale dans la commune ; chacun de ces groupes sera traité à part et recensé exhaustivement, son année venue. Dès lors sur une période de cinq ans toutes ces adresses auront été enquêtées et l'effet de grappe aura disparu.

La notion de grande adresse est relative : une adresse est grande si elle contient un nombre de logement dans le dernier décile de la distribution de la taille des adresses de la commune60.

Seuls les grandes adresses du dernier décile sont enquêté exhaustivement. Ces observations ont alors avant la prise en compte des différentes années de collecte des poids de sondage de 1.

En ce qui concerne les autres types d'adresses, elles ne sont pas enquêtées de manière exhaustives. « Chaque année, un échantillon aléatoire d'adresses est tiré dans le groupe de l’année. Pour ce tirage de deuxième phase, on introduit comme critères d’équilibrage le nombre de logements de la strate, le nombre de logements collectifs et le poids des IRIS en nombre de logements » (Insee. Pour comprendre le recensement Annexe B2 : Le plan de sondage dans les communes de 10 000 habitants ou plus,p.361). Nous comprenons que le

tirage au sort vise à retenir des logements représentatifs spatialement de l'ensemble de la commune. Pour cela il est utilisé une strate géographique présentée par la suite. La documentation nous informe que les poids de sondage des observations autres que les grandes adresses sont en général compris entre 2,5 et 5 et le plus souvent près de 3.

Les poids sont ajustés par la suite pour estimer un effectif moyen sur les cinq années de collecte. Ils demeurent en moyenne proche de 3.

Enfin, contrairement aux communes de moins de 10 000 habitants l'exploitation complémentaire utilise tous les bulletins de recensement des grandes communes. Donc les poids de sondage demeurent identiques à celui de l'exploitation principale.

-La strate géographique : les IRIS et IRIS-2000

Les échantillons des adresses sont tirés au sort chaque année de manière à avoir à peu près le même nombre de logements par IRIS. Le support spatial IRIS est utilisé pour stratifier le tirage au sort et assurer sa représentativité dans l'espace des communes de plus de 10 000 habitants.

Les IRIS sont construits à l'aide d'un autre découpage, les IRIS-2000. Jusqu'en 1999, le recensement général de la population (RGP) utilisait déjà un découpage infra-communal de

60 Une commune avec beaucoup de grandes adresses aura toujours un effet de grappe. Sauf si bien sûr il n'y a que des grandes adresses.

61 Insee. Pour comprendre le recensement Annexe B2 : le plan de sondage dans les communes de 10 000 habitants ou plus [en ligne] (consulté le 06/05/2016)

collecte : l'îlot. L'ancienne méthode du recensement était un comptage exhaustif. Selon la loi sur le secret statistique, l'information du RGP ne pouvait être diffusée sur ce support géographique tellement fin que l'on peut y reconnaître les individus. Alors les résultats ont été agrégés sur un support nommé IRIS-2000 signifiant « Îlots Regroupés pour l'Information Statistique » et qui fait référence à la taille visée de 2 000 habitants par maille élémentaire. Avec le recensement rénové, les IRIS-2000 ont été mobilisés indirectement comme strate de la base de sondage et non plus comme support de diffusion. En effet, les critères d’équilibrage des groupes de rotation des adresses sont issus du recensement de 1999 (nombre de logement individuel et collectif, population par sexe et âge).

Mais comme le territoire change, le recensement rénové diffuse les résultats des grandes communes sur un support IRIS actualisé régulièrement. Ce découpage est le support sur lequel les localisations résidentielles sont diffusées dans certains fichiers détail du recensement pour préserver l'anonymat. Indirectement, les IRIS sont issus des IRIS-2000 et de leur méthodologie, mais ils diffèrent. En effet, ils sont construits de manière à contenir 2 000 habitants et les effectifs dénombrés dépendent du tirage au sort des adresses au sein des groupes, qui sont construits à l'aide des IRIS-2000.

Afin de garantir que les IRIS soient homogènes en termes de population le découpage évolue dans le temps. Les IRIS sont mis à jour après chaque année de collecte. Lorsque un IRIS devient trop peu habité il est agrégé avec un autre IRIS. Lorsque celui-ci redevient de taille suffisante il est recréé. Comme le support IRIS évolue dans le temps pour être homogène en population il ne peut pas être utilisé comme strate de sondage. Des adresses pourraient changer de groupe de rotation d'année en année et être enquêtées plusieurs fois. De plus, nous remarquons que les évolutions du support IRIS peuvent rendre délicate les analyses temporelles des résultats du recensement. C'est pourquoi ce sont les IRIS-2000 qui sont utilisés pour définir les groupes de rotation des adresses. Et, dans un second temps, les adresses à enquêter une année donnée sont tirées au sort en assurant une répartition homogène en introduisant comme critère d'équilibrage le poids des IRIS en nombre de logement. Ces deux supports sont donc utilisés comme strate de sondage. Il n'y pas de problème de non-alignement des supports puisque l'Insee dispose des adresses des logements comme support le plus fin.

devons nous poser la question sur les hypothèses de construction qu'ils posent. Les poids de sondage sont construits pour estimer l'effectif de population à l'année médiane des cinq enquêtes annuelles. Le dénombrement des populations par type de variable socio-économique peut être alors source de biais. Nous nous intéressons donc brièvement à la précision du recensement.