• Aucun résultat trouvé

5.2 L’enquˆete : gen`ese et m´ethodologie

5.2.1 Traitement des donn´ees brutes

Le souci de produire un fichier de donn´ees propre, nous a conduits avant tout ´a proc´eder aux contrˆoles des r´eponses et de la structure des donn´ees. En particulier, apr`es avoir concat´en´e les trois fichiers de donn´ees issus des diff´erentes r´eponses en un fichier de donn´ees, nous avons rep´er´e les valeurs aberrantes, extrˆemes, et les avons supprim´ees du fichier. Ainsi, 12 r´eponses venant de l’´etranger, hors du territoire fran¸cais ont ´et´e supprim´ees et finalement nous ne consid´erons que 498 r´eponses sur les 510 initialement valid´ees.

Apr`es v´erification, toutes les r´eponses aux questionnaires sont av´er´ees abouties (c’est-`a-dire remplies jusqu’au bout) et pertinentes (pas de r´eponses incongrues) et donc toutes exploitables `a des fins d’analyse.

Les ´etapes de l’apurement et de la visualisation des donn´ees dans le traitement des donn´ees d’enquˆetes sont des ´epreuves de coh´erence globale et de structuration de donn´ees qui permettent de valider et de critiquer de fa¸con plus approfondie et de renouveler l’information de base.

Les donn´ees4 que nous nous proposons d’analyser ici sont donc r´esum´ees dans

un tableau de 498 lignes(individus) et 141 colonnes (variables).

A partir de cet ´echantillon global (498 femmes), un aper¸cu descriptif des femmes de 18 `a 75 ans consult´ees lors de notre enquˆete permettra de rendre compte de la repr´esentativit´e de l’´echantillon, de connaˆıtre les profils des femmes ayant r´epondu au questionnaire afin de mieux rechercher l’information sur ce que l’on veut ´etudier et de r´epondre aux questions pos´ees dans l’enquˆete. On notera que l’on s’est limit´e aux quelques caract´eristiques socioprofessionnelles et aux situations g´eographiques.

Age

L’ˆage5 est donc une des variables essentielles de cette enquˆete. Nous avons d´efini

des tranches d’ˆage : les 18-30 ans, les 30-40 ans, les 40-50 ans, les 50-60 ans et les 60-75 ans et ´etudier leur impact sur ces diverses r´eponses d´eclaratives.

Elles sont majoritairement ˆag´ees de moins de 40 ans : 66,5% des r´epondantes sont des femmes de moins de 40 ans, contre pr`es de 1/3 de femmes ( 33,5%) de plus de 40 ans. Parmi les moins de 40 ans, plus de 2/3 sont des femmes ˆag´ees de 18 `a 30 ans, une proportion importante qui pourrait avoir un rapport avec le mode de recrutement par l’internet. Les moins jeunes ´etant particuli`erement vis´ees `a l’origine par l’enquˆete contrairement `a beaucoup d’autres ´etudes relatives au cancer du sein qui ne concernent que les plus de 50 ans, elles seront une cible `a privil´egier dans le cadre de futures pistes d’actions de pr´evention contre le cancer du sein.

Au contraire, on note que la proportion des plus de 50 ans, celles auxquelles s’adresse le d´epistage organis´e, est relativement moins importante (autour de 15%). On peut d’ailleurs se demander si c’est parce que cette tranche de femmes est peu repr´esent´ee parmi les femmes ayant r´epondu au questionnaire ou juste parce que ces femmes n’avaient pas souhait´e r´epondre au sondage.

une observation (questionnaire), chaque colonne `a une variable (question ou partie de question). Pour simplifier l’analyse des donn´ees et dans la pratique, presque syst´ematique avec ce type de donn´ees (nombreuses variables qualitatives) : les modalit´es de chacune des variables ont ´et´e cod´ees 1, 2... C’est nettement plus commode pour l’enregistrement des donn´ees sur support informatique, la production des fichiers d’analyse des donn´ees et sortie des tableaux requis pour l’analyse des donn´ees. Mais, cela n´ecessite un recodage pour faire apparaˆıtre explicitement les modalit´es initiales dans un tableau ou sur un graphique. Une phase de recodage des donn´ees est donc en g´en´eral n´ecessaire avant de mettre en oeuvre une AFC ou une A.C.M car le logiciel R utilis´e plus loin, va consid´erer les donn´ees chiffr´ees comme des donn´ees quantitatives (susceptibles de donner lieu `a des calculs de moyennes par exemples) et les donn´ees textuelles comme des donn´ees qualitatives.

5. L’ˆage est le facteur de risque le plus important car 80 % des cancers du sein apparaissent chez des femmes ne pr´esentant aucun autre facteur de risque. Le risque augmente avec l’ˆage car moins de 10% des cancers du sein surviennent avant 40 ans.

Figure 5.1 – histogramme des ˆages

Statut social

La r´epartition est la suivante : 70% d’actifs, 15,5% d’autre situation (´etudiantes et autres), 3,5% de retrait´ees, 2% de femmes au foyer et 9% de personnes sans emploi.

Si l’on regarde plus pr´ecis´ement la liste des professions repr´esent´ees, on constate que la plupart des r´epondantes sont issues de cat´egories socioprofessionnelles sup´erieures (39%), voire interm´ediaires (11%). Les employ´ees sont repr´esent´ees avec pr`es de 19% des r´epondantes. En revanche, les ouvri`eres, les exploitantes agricoles, les artisans commer¸cantes et les retrait´ees sont peu repr´esent´ees, ce fait r´ev´elant le besoin de chercher ´eventuellement `a les toucher davantage. Les ´etudiantes sont ´egalement tr`es peu repr´esent´ees (5%), ce qui peut sembler assez surprenant : on pourrait en effet s’attendre `a trouver parmi les enquˆet´ees de nombreuses ´etudiantes, dans la mesure o`u l’enquˆete est mise en ligne sur le site de CERSES et que l’information est relay´ee aupr`es des ´etudiantes des universit´es par email.

Origine g´eographique

Mˆeme si les r´eponses au questionnaire proviennent de toute la France (Idf, Nord, Centre, Nord-Est, Nord-Ouest, Sud-Est, Sud-Ouest, Dom ), c’est d’Ile-de-France que proviennent plus de la moiti´e des r´eponses (57,6%). On note aussi que 16% des r´epondantes viennent du Sud-Est et 10,44% du Nord-Ouest de la France.

Il s’agit d’une analyse pr´eliminaire descriptive permettant de r´esumer les donn´ees disponibles sans aucun test statistique. Elle permettra de rendre compte de la

repr´esentativit´e de l’´echantillon, de connaˆıtre les femmes ayant r´epondu au ques- tionnaire afin de mieux rechercher l’information sur ce que l’on veut ´etudier et de r´epondre aux questions pos´ees dans l’enquˆete. Les analyses statistiques qui suivront, s’attacheront `a identifier la vari´et´e des attitudes et comportements de pr´evention, perceptions et informations, `a les relier `a la situation du cancer du sein, en exploitant la mani`ere dont se nouent les relations entre variables pertinentes de l’enquˆete.