• Aucun résultat trouvé

Chapitre 1. PROBLÉMATIQUE

4. MÉTHODOLOGIE

4.4. Préparation de la base de données

Une fois la collecte de données terminée, les réponses du questionnaire ont été exportées de Limesurvey vers le logiciel d’analyse statistique SPSS version 25.0. Des analyses

descriptives et des croisements ont été effectués pour éliminer les doublons, pour tenter de repérer et de corriger des erreurs et pour former des catégories pour les questions ouvertes. La première modification dans les données a été d’identifier chaque répondant à partir de la liste de contact et d’ajouter, au besoin, des précisions entre parenthèses à la suite du nom de la municipalité. Par exemple, pour toutes les municipalités portant le même nom ‘ABCD’ dans une même province, le type de municipalité a été précisé, par exemple ‘town of ABCD’ et ‘rural municipality of ABCD’ afin de confirmer qu’il ne s’agissait pas de doublons. Ensuite, pour la question où le répondant devait indiquer le titre de son poste, une option ‘Autre’ était disponible et ces réponses ont été déplacées dans une catégorie existante du menu déroulant lorsque possible. Plus précisément, dans plusieurs provinces anglophones il y a des appellations différentes pour désigner le Directeur général, par exemple, les réponses General Director, Chief Administrative Officer, General Manager et City Manager ont toutes été combinées en une catégorie, car elles sont équivalentes. Concernant les informations sociodémographiques des répondants, certains ont indiqué ne pas vouloir inscrire leur âge exact. Par souci de laisser un libre choix au répondant, même si cette question était obligatoire dans la configuration du questionnaire en ligne, il a été suggéré à ces répondants d’inscrire une valeur invalide telle que 0 ou 100 par exemple. Lors de la préparation de la base de données, ces valeurs invalides ont été facilement repérées et supprimées afin de ne pas fausser l’âge moyen des répondants.

Ensuite, malgré l’indication de compléter une seule fois le questionnaire pour chaque municipalité, il y avait 25 doublons présents qui ont dû être traités manuellement pour ne conserver qu’un répondant pour chaque municipalité. Pour certains doublons, lorsqu’un des questionnaires était incomplet, seul le questionnaire complété en totalité était conservé. Lorsque deux questionnaires complets étaient présents, ceux ayant le plus de réponses de type Oui ou Non étaient privilégiés plutôt que ceux ayant de nombreux Je ne sais pas. Une fois tous les répondants bien identifiés, le code de municipalité de Statistique Canada a été associé à chaque municipalité. Cette étape a été réalisée manuellement, car l’orthographe des municipalités était parfois légèrement différente entre la base de données et les fichiers de Statistique Canada, par exemple, ‘St. ABCD’ au lieu de ‘Saint-ABCD’. Ensuite, il a été

possible d’ajouter les autres caractéristiques des municipalités en combinant les fichiers de Statistique Canada selon le code de municipalité.

Certaines municipalités avaient des contextes particuliers qui ont dû être traités individuellement lors de la préparation de la base de données. D’abord, lors de l’ajout des caractéristiques des municipalités, certaines données étaient manquantes pour le pourcentage d’aînés âgés de 65 ans et plus et la densité de population. Ces données manquantes concernaient moins d’une dizaine de municipalités parmi les répondants au questionnaire en ligne. Selon G. Déziel Bouton de Statistique Canada (communication personnelle, novembre 2017), ces données sont manquantes car certaines municipalités se trouvent dans la liste des régions géographiques non diffusées pour le recensement de 2016. Les régions géographiques non diffusées comptent une population totale inférieure à 40 résidents et ces données sont supprimées pour des raisons de confidentialité. Étant donné le petit nombre de municipalités pour lesquelles ces données sont manquantes, l’imputation de données manquantes n’a pas été nécessaire lors de l’analyse des données. Également, certaines municipalités étaient divisées en plusieurs SDR et, dans ce contexte, une SDR ne correspond pas aux limites géographiques de la municipalité. C’était le cas pour trois répondants de municipalités de la Nouvelle-Écosse pour lesquelles les caractéristiques des municipalités des SDR composant les municipalités ont dû être combinées avant d’être ajoutées à la base de données. Par exemple, le pourcentage moyen d’aînés de 65 ans et plus a été calculé pour une municipalité composée de trois subdivisions de recensement. Inversement, la plupart des SDR de l’Île-du-Prince-Édouard regroupent plusieurs municipalités en lots, donc les caractéristiques telles que le pourcentage d’aînés âgés de 65 ans et plus et la densité de population disponibles correspondent à plusieurs municipalités combinées. Dans ce contexte, comme nous n’avions pas toutes les municipalités d’un lot ayant répondues au questionnaire, il n’était pas possible d’utiliser les caractéristiques fournies dans le recensement, ce qui a résulté en données manquantes pour sept municipalités répondantes.

Concernant les indices de défavorisation matérielle et sociale, tel que détaillé dans la section portant sur les variables à l’étude, les moyennes pondérées ont été calculées afin d’obtenir le rang moyen pour chaque municipalité. Ensuite, afin de déterminer quel type de regroupement

est le plus approprié, soit en quartiles ou en quintiles, la distribution des données a été observée pour la défavorisation matérielle (Figure 4) et sociale (Figure 5). D’abord, autant pour la défavorisation matérielle que sociale, l’indice de défavorisation par subdivision de recensement est fréquemment un nombre entier, ce qui signifie que plusieurs SDR étaient composées d’AD ayant toutes le même indice de défavorisation. Cette distribution confirme qu’il n’était pas possible d’analyser ces indices de façon continue et qu’ils devaient être regroupés par catégories. Concernant la défavorisation matérielle, la distribution des valeurs des indices de défavorisation était inégale, près du tier (31,7 %) des SDR avaient un indice d’une valeur de 5, ce qui rendait la répartition en quintiles impossible. La répartition en tertiles aurait pour sa part entraîné une grande perte de variabilité alors que la répartition en quartiles permettait d’avoir une répartition de près de 25 % dans chaque groupe tout en gardant une variabilité intéressante. Par souci d’uniformité, la répartition en quartiles a aussi été utilisée pour les indices de défavorisation sociale (Tableau 6). Les valeurs en quartiles ont donc été attribuées à chaque municipalité répondante, où le premier quartile correspond à un milieu plus favorisé et le quatrième quartile correspond à un milieu plus défavorisé.

Figure 4.

Distribution de l’indice moyen de défavorisation matérielle selon les subdivisions de recensement

Figure 5.

Distribution de l’indice moyen de défavorisation sociale selon les subdivisions de recensement

Tableau 6.

Répartition des SDR selon les quartiles de défavorisation matérielle et sociale (n=3 856) Défavorisation matérielle Défavorisation sociale

Fréquence (%) Fréquence (%)

Quartile 1 893 (23,2) 964 (25,0)

Quartile 2 933 (24,2) 964 (25,0)

Quartile 3 809 (21,0) 964 (25,0)