• Aucun résultat trouvé

1.2 (Dés)organisation de Mumbai

Chapitre 3. Enquêter la subjectivité des parcours de vie à Mumbai

3.4 Transformer les données pour les analyser

La récolte des questionnaires (et leur traduction) n’a été que la première étape de la préparation des données en vue de leur analyse. En second lieu, les réponses aux différents volets, traduites en anglais, ainsi que les données complémentaires, ont été retranscrites sur des fichiers informa-tiques Excel. Puis, nous avons procédé à l’élaboration des bases de don-nées et à la construction des variables descriptives sociodémographiques nécessaires aux analyses. Finalement, un long processus de codification des trois volets de l’enquête, sur le modèle des typologies utilisées dans

le programme CEVI, a permis l’opérationnalisation des réponses et leur traitement de manière quantitative.

3.4.1 Bases de données et variables sociodémographiques

Lors du terrain passé à Bandra, la saisie et la traduction ont été entière-ment exécutées par des personnes recrutées par le CSSC et rémunérées à cet effet. Pour le terrain de Santa Cruz, je me suis moi-même chargée de l’essentiel de la saisie (les questionnaires ayant été auparavant traduits en anglais à même le papier). Par ailleurs, je suis repassée sur l’ensemble des questionnaires pour vérifier l’exactitude des retranscriptions. Il m’était impossible de reprendre la traduction ; en revanche, un certain nombre de détails ont pu être contrôlés, complétés voire corrigés. Les numéros (dates et âges), certains mots récurrents, les lieux ainsi que les oublis de traduc-tion étaient à ma portée.

Une fois les fichiers Excel complétés, ils ont été transférés sur SPSS pour leur nettoyage et l’opérationnalisation des variables. Une base spéci-fique aux questions complémentaires, sociodémographiques, a été con-stituée, ainsi qu’une base par volet, pour chacune des enquêtes. Ensuite, il a été aisé de les fusionner au fur et à mesure des besoins analytiques. A ce stade, seules des bases «individu» ont été constituées : il s’agit de fichiers où chaque ligne représente un répondant.

Le nettoyage des données (c’est-à-dire le contrôle et l’homogénéisa-tion des variables sociodémographiques et des quesl’homogénéisa-tions ouvertes entre les deux enquêtes) a représenté l’étape suivante. Une fois les bases portant sur les différents volets du questionnaire rigoureusement similaires, il a été possible de constituer de nouveaux fichiers SPSS, cette fois restructurés selon la logique d’un événement par ligne (soit des bases «changement», comprenant quatre fois plus de lignes que les bases individus). Ce second format offre l’opportunité de se focaliser sur les réponses données par les personnes, il a notamment permis d’effectuer des analyses de régression.

Les variables sociodémographiques

Cinq variables sociodémographiques et socioéconomiques ont été uti-lisées pour spécifier les caractéristiques individuelles des répondants.

La première tient compte du lieu de résidence, soit du quartier où s’est déroulé le terrain (Bandra ou Santa Cruz). Les deux variables suivantes

sont directement liées aux critères d’échantillonnage : le groupe d’âge et le sexe. Pour ces trois premières variables, indispensables à la construction de nos échantillons, aucune valeur manquante n’est à déplorer.

Un quatrième indicateur a été constitué d’après le niveau d’éducation, séparé en quatre degrés : illettré, école primaire, secondaire et supérieure (ce dernier groupe comprenant université et secondaire supérieur), afin d’obtenir des catégories plus ou moins égales en quantité d’individus (cf.

tableau 3.2)31. Une seule valeur manquante apparaît, à Bandra. Finale-ment, la santé auto-évaluée a aussi été retenue comme variable explicative et ne contient que 11 valeurs manquantes (à Bandra également). Elle a été subdivisée en quatre niveaux : très bonne, bonne, moyenne et mauvaise (cette dernière catégorie incluant les personnes se déclarant en très mau-vaise santé) (cf. tableau 3.2).

Les autres variables descriptives (religion, cohabitation, avoir des enfants, état civil, activité) présentent trop de déséquilibres (entre l’un et l’autre des items, ou entre l’une et l’autre des classes d’âge); elles n’ont pas été conservées dans les analyses (à une exception près, la variable reli-gion, que nous avons utilisé une fois, voir chapitre 8). De plus, la variable d’activité est soumise à interprétation: au vu du contexte de forte infor-malité du marché du travail, le fait d’être en étude, sans emploi, au foyer ou à la retraite ne signifie pas pour autant que la personne ne travaille pas;

il aurait donc été délicat de séparer ces catégories de personnes.

La caste: une variable impossible

En outre, au regard de la présentation du contexte indien faite dans le chapitre premier, l’absence de l’utilisation de la caste comme indicateur de situation sociale ne peut que surprendre. Il est clair que les castes jouent toujours un rôle majeur dans la société indienne : en tenir compte dans nos analyses semble de prime abord évident. Néanmoins, plusieurs explica-tions justifient que ce ne soit pas le cas dans ce travail.

Tout d’abord, bien que chaque Indienne et chaque Indien de confes-sion hindoue naisse dans une caste (ou comme Dalit) et soit capable de reconnaître d’un regard la position d’autrui, l’interdiction de discrimina-tion sur la base des castes – inscrite dans la Constitudiscrimina-tion indienne depuis

31 L’école primaire en Inde s’étend de l’âge de 6 à 12 ans; l’école secondaire de 13 à 16 ans et le supérieur de 16 ans jusqu’à la fin des études universitaires. Le 12th standard est l’année de l’examen final décisif pour l’entrée à l’université, qui se trouve inclus dans cette dernière catégorie.

1949 – crée un environnement pesant lorsqu’il s’agit de demander à quelqu’un sa caste dans le cadre d’une enquête. Ce qui explique que nous ayons choisi de ne pas réclamer cette information aux répondants de Santa Cruz, afin de ne pas susciter de tension, ou d’inconfort, pour les enquêtés et les enquêteurs ; qui plus est, le rapport de force inhérent à la relation interviewé-intervieweur s’en serait trouvé affecté, probablement maximisé (voir ci-dessous pour une discussion plus approfondie de ce point).

Sans doute, une certaine dose de prudence (possiblement exagérée) s’est-elle aussi imposée à nous, chercheurs occidentaux s’immisçant dans un monde dont nous étions en partie ignorants, pour ne pas y transgresser des règles que nous ne saurions évaluer ou que nous n’aurions pas prévues, provoquant des conséquences que nous ne saurions maîtriser.

Par ailleurs, d’après les informations fournies par le CSSC, nous sav-ions que les habitants de Bandra sont très généralement Dalits. Si l’on ajoute à cette catégorie les musulmans résidant dans les bidonvilles, dont les conditions de vie et d’exclusion sont proches, une très large majorité de notre échantillon interrogé dans les slums est Intouchable. L’informa-tion se recoupe donc avec le lieu de résidence. Face à ces arguments, nous avons préféré nous contenter de cette dernière variable comme indicateur socioéconomique, en reconnaissant toutes les limites de ce choix.

3.4.2 Interpréter le subjectif pour le rendre quantifiable : typologies et codifications des trois questions ouvertes

Le travail le plus long fut celui du codage des trois volets de l’enquête selon deux critères de classification. La première de ces typologies con-cerne les changements personnels (volet I et II) et la seconde les change-ments sociohistoriques (volet III). Elles sont présentées ci-dessous.

Tout au long de ce livre, nous utilisons en outre plusieurs autres typol-ogies, reposant sur des concepts différents : les capitaux ou ressources à disposition (chapitre 4), l’agency et l’individualisation présentes dans les souvenirs (chapitre 9), le degré de bifurcation compris dans ces mentions (chapitre 9), la connotation positive ou négative des réponses (chapitre 9). Ces grilles de lecture sont explicitées dans les chapitres concernés.

Finalement, lorsque cela s’avère nécessaire, nous élaborons aussi une cod-ification des raisons avancées par les répondants pour expliquer les choix