• Aucun résultat trouvé

Chapitre 2 : Spécification des questions de recherche, méthodologie et données

2.2 Source des données

2.2.1. Base de données

Les données utilisées pour les analyses à venir seront tirées des divers recensements canadiens. Communément, un recensement recueille, évalue, publie et diffuse des données à caractères démographique, économique et social concernant, à un moment donné, tous les habitants d’un pays (Tabutin, 2002). L’objectif du recensement d’un territoire désigné est donc de dresser un portrait statistique de la population résidant sur ce territoire à un moment donné.

Tous les recensements canadiens depuis 1971 sont caractérisés par l’obligation imposée à chaque ménage de répondre aux questions du formulaire qu’il a reçu. Le recensement de 2011 fait cependant exception lorsqu’il s’agit du questionnaire long (appelé « Enquête nationale auprès des ménages »). C’est pourquoi nous l’avons exclu. En effet, si les questions sur la langue maternelle et la langue d’usage à la maison figurent bien sur le questionnaire du recensement court, auquel tout le monde devait répondre, la question sur la langue de travail se retrouvait par contre dans le recensement long. Comme la réponse au questionnaire de ce dernier n’était pas obligatoire, il en est résulté que les résultats de cette « enquête » auprès des

ménages posent, selon ce qu’affirme Statistique Canada, des problèmes de fiabilité, surtout pour des territoires plus petits que les provinces (région, comtés, municipalités). D’une manière générale, Statistique Canada considère que les résultats linguistiques pour 2011 doivent être utilisés avec beaucoup de précaution. Si nous les avons utilisés précédemment (dans la section 1.1.), c’est parce qu’alors il s’agissait de décrire brièvement le contexte général dans lequel se situait la problématique démolinguistique du Québec. Pour une analyse plus approfondie, il nous est apparu qu’il était plus prudent de nous limiter au recensement de 2006.

Le recensement canadien de 2006 (tous comme les précédents) se compose donc de deux questionnaires, la totalité de la population recevant un questionnaire « abrégé» comportant huit questions avec les variables de base (âge, sexe, lieu de naissance, lieu de résidence, langue maternelle, etc.), et (en 2006) 20% de la population recevant un questionnaire « long », plus complet, comprenant les huit questions du questionnaire abrégé plus 53 questions additionnelles portant, en plus des variables de base, sur l’éducation, la migration, la fécondité, l’emploi, les langues… (Statistique Canada, 2008).

Le Canada est un des pays les plus documentés en matière de comportements linguistiques. De nombreuses questions relatives à la langue sont en effet intégrées au recensement et aux différentes enquêtes menées par Statistique Canada (Bélanger et Sabourin, 2013). La langue maternelle et la langue d’usage à la maison (indicateurs privés) ainsi que la langue de travail (indicateur public), qui constituent les principaux indicateurs linguistiques de notre analyse, sont donc couverts par le recensement canadien.

Outre les résultats linguistiques du recensement de 2006, à des fins de comparaison et dans l’objectif de suivre l’évolution des groupes linguistiques dans le temps, les données provenant du recensement de 1971 pour la langue maternelle et la langue d’usage à la maison seront également utilisées. Rappelons qu’en ce qui concerne la langue de travail, donc pour l’espace public, la question n’a été introduite qu’au recensement de 2001. L’étude de l’évolution de la

structure par âge pour les groupes linguistiques définis selon cet indicateur sera donc nécessairement limitée à une période très courte.

Enfin, la réalisation de ce travail exigera, en complément des recensements canadiens, la consultation de diverses sources de données, parmi lesquelles nous retrouverons les études et analyses déjà publiées, des articles académiques, des rapports, thèses et mémoires.

Limite des recensements

De par sa grande couverture statistique et géographique qui s’étend du niveau le plus large (niveau national : Canada) au niveau le plus local (quartier par exemple) ainsi que par la possibilité d’étudier de nombreux sous-groupes (linguistiques, ethniques, sociaux, etc.), les données issues des recensements ont un intérêt évident pour tout chercheur (Tabutin, 2002). Cependant, il est primordial de garder à l’esprit que les recensements ne sont pas exempts d’erreurs.

Il existe plusieurs sources d’erreurs que Statistique Canada a regroupées en différentes catégories, telles les erreurs de couverture, de non-réponse, de traitement et d’échantillonnage (Statistique Canada, 2008). Un problème particulier est celui des réponses multiples, qui ne sont pas en soi des erreurs, mais peuvent être une source d’erreurs. Nous en discuterons de façon séparée, car le traitement des réponses multiples peut avoir des conséquences sur l’interprétation des résultats.

Le recensement canadien de 2006 permet des réponses multiples à certaines questions, notamment pour les questions linguistiques. De ce fait, de nombreux répondants déclarent plus d’une langue aux questions relatives à la langue maternelle, la langue d’usage à la maison ou bien encore la langue de travail. Ces réponses multiples étant d’un nombre non négligeable, nous sommes obligés de les prendre en compte. Nous ne pouvons cependant pas les prendre à part, car au recensement de 1971, les réponses multiples n’étaient pas admises. Dans les rares cas où il y en avait, Statistique Canada les répartissait entre les langues uniques. Donc, afin de pouvoir comparer les données de 2006 aux données de 1971, nous avons redistribué les réponses multiples de 2006 dans les catégories linguistiques appropriées. Par exemple, la population de la catégorie « anglais et français » a été divisée en deux puis répartie de manière égale entre la catégorie « anglais » et la catégorie « français ».

Nous avons procédé de la même manière pour les catégories « anglais et langue non officielle » et « français et langue non officielle » en répartissant la population de manière égale dans leurs catégories respectives. Enfin, pour la dernière catégorie, soit « anglais, français et tierce », nous avons utilisé la même méthode sauf que nous avons divisé cette catégorie en trois. Nous avons ensuite réparti la population de manière égale dans chacune des trois catégories anglais, français et tierce. Nous obtenions ainsi nos trois groupes linguistiques souhaités : anglais, français et tierce (langue non officielle). Nous avons effectué cette démarche pour chacun des groupes d’âge. Ces modifications nous ont permis de rendre comparables les résultats linguistiques des recensements canadiens de 1971 et de 2006.