• Aucun résultat trouvé

Construction, description et anonymisation des corpus

Chapitre IV Matériels et méthodes

IV.2 Description et construction des corpus de données

IV.2.3 Construction, description et anonymisation des corpus

Cette étude s’appuie donc sur trois sources de données : (1) les détails de communications téléphoniques issus du système d’information de l’opérateur Orange, traces de l’activité téléphonique des participants, (2) les données journalières issues des carnets de bords et (3) les résultats trimestriels d’une batterie de questionnaires psychotechniques. Le recueil a débuté au mois de janvier 2012 a pris fin au mois de septembre 2013.

L’étude a par ailleurs fait l’objet d’un dépôt d’autorisation à la CNIL au mois d’avril 2011. La Charte du Bon Usage des Ressources Informatiques d’Orange, nécessaire pour accéder aux données de communication, a également été signée le 30 juin 2010. Enfin, chaque participant a signé un consentement de participation valable un an. La démarche fut renouvelée lorsque les sujets souhaitaient poursuivre la collaboration au-delà d’une année.

Toutes les informations recueillies ont fait l’objet d’une anonymisation et les détails de communications ont été encryptés avant d’être mis à la disposition de l’équipe de travail. Il a

OBJECTIF METHODE TYPE GRANULARITE

Observer des modifications de pattern Extraction automatique Métadonnées téléphoniques Par communication

Autoévaluation Apprécier quotidiennement le niveau de santé et de moral Echelle de Lickert Echelle de jugement Quotidienne

Verbatim Recueillir des information explicitant les autoévaluation Expression libre Données qualitatives Quotidienne

GDS Evaluer la symptomatologie dépressive Questionnaire Score Trimestrielle

ISPN Evaluer la santé perçue (6 dimensions) Questionnaire Score Trimestrielle

SF-36 Evaluer la santé perçue (8 dimensions + 2 agrégats) Questionnaire Score Trimestrielle

OUTIL

Carnet de bord

Evaluation

psychométrique

Détails de communication

également été validé que le projet ne relève pas de la loi Huriet-Sérusclat, relative à la protection des personnes qui se prêtent à des recherches biomédicales.

IV.2.3.1 Les données téléphoniques

A compter de la date de signature du consentement de participation, nous disposions des relevés téléphoniques des participants pendant une année complète. Les sujets ayant renouvelés leur consentement nous ont permis de réaliser des périodes de suivi allant jusqu’à vingt mois.

Parmi les nombreux paramètres contenus dans les fichiers extraits du système d’information d’Orange, nous avons retenu une liste de soixante-dix-sept variables construites sur la base des informations téléphoniques brutes. Nous disposions ainsi entre autres d’informations relatives à la date, l’heure, la durée des communications, le sens des appels (entrants ou sortants), les appels manqués, les durées de sonnerie ainsi qu’au nombre de correspondants différents.

Aussi, dans le but de réaliser des analyses sur des groupes spécifiques de correspondants : la famille, l’entourage et les professionnels de santé, nous avons réalisé un entretien particulier afin d'identifier les principaux contacts téléphoniques.

Outillés d’une liste des numéros de téléphone contactés par le sujet au cours de l’année précédente, classée par fréquence d’appel, nous avons lors de cet entretien, cherché à identifier chaque numéro pour ensuite les désigner à l’aide d’une étiquette générique de type « Famille », « Entourage » ou « Professionnel de santé ». Ainsi, nous sommes parvenus avec chaque participant, à identifier 50% des numéros listés.

C’est après cette entrevue que tous les numéros contenus dans la base de données ont été rendus anonymes avec une clé de cryptage. Les correspondants non identifiés lors de l’entretien apparaissaient sous la forme d’une chaîne de caractères unique, les autres sous la dénomination de leur étiquette.

En fin de compte, les données téléphoniques permettaient de quantifier le nombre d’appels, de distinguer les différentes catégories de contacts, d’identifier ceux qui étaient les plus récurrents, de comptabiliser le nombre de personnes qui ont communiqué ou ont tenté de communiquer avec un sujet un jour donné, d’établir si un appel à abouti ou s’il fut manqué et déterminer si celui-ci fut une communication entrante (c’est-à-dire reçue par le sujet) ou sortante (autrement dit, initiée par le sujet), calculer les durées moyennes de communication, de sonnerie etc.

IV.2.3.2 Les carnets de bord

Chaque participant disposait d’un carnet de bord prenant la forme d’un agenda au sein duquel il lui était demandé de consigner chaque jour une évaluation de sa santé et de son moral sur une échelle à quatre points allant de « très mauvais » à « excellent ». Nous avions initialement pris le soin de dichotomiser la valence des états afin de forcer les participants à choisir entre les modalités « bonne » et « mauvaise » mais certains sujets ayant coché régulièrement l’emplacement entre « Mauvais » et « Bon », nous avons ajouté une modalité lors de la saisie des réponses. Ainsi l’échelle fut enregistrée en cinq points, allant de -2 pour « Très mauvais » à +2 pour « Excellent », en passant par la valeur zéro pour cet item intermédiaire. D’autre part, une section spécifique du carnet de bord, matérialisée par une vignette, était destinée à la consigne de tous les événements relatifs à la santé, au moral ou à la vie social.

Figure 4. Visuel d’un feuillet de carnet de bord

Les informations transcrites par les sujets dans la vignette ont fait l’objet d’un recodage à la suite d'une analyse de contenu. Au total, sept grandes thématiques ont émergées : la santé (rendez-vous médicaux, maladies, douleurs, chutes, troubles du sommeil), le moral (anxiété, déprime, solitude), les visites et les sorties d’ordre social (avec amis, famille ou autres), les visites d’aides, les évènements familiaux (anniversaires, repas de fête, naissances, décès, mariages, vacances…), les activités domestiques (TV, internet, jardinage, ménage, jeux, lecture…) et des renseignements sur la météo.

L’ensemble des données a été saisi sur un serveur afin de réaliser ultérieurement les traitements statistiques.

Pour le codage des informations, nous avons opté pour un raisonnement binaire traduisant l’absence ou la présence d’un évènement : lorsque des évènements particuliers furent mentionnés, (comme une visite ou une maladie par exemple) ils ont été codés « présent » et à contrario, en l’absence de mention, tous furent codés « absent ».

Concernant les évaluations de santé et de moral sur l’échelle ordinale à cinq point, puisque nous ne connaissions pas les raisons qui ont conduit les sujets à ne pas remplir leur calendrier un jour donné, nous avons enregistré spécifiquement dans la base cette absence avec le code « 999 ». Les

journées où aucune information ne fut consignée45 n'ont pas été prises en compte dans l'analyse.

IV.2.3.3 Les évaluations psychotechniques

Ces mesures nous ont permis de surveiller régulièrement l’évolution de plusieurs dimensions en rapport avec l’activité sociale et le bien-être. Le choix de ces évaluations particulières parmi les nombreuses disponibles fut basé d’une part sur leur validation auprès de la population âgée, d’autre part sur leur sensibilité à mesurer des changements sur le court terme et enfin pour leur facilité de passation.

Au final, nous avons retenu le Short Form-36, pour estimer le niveau de bien-être physique et psychique, l’Indicateur de Santé Perçue de Nottingham, pour suivre six dimensions en rapport avec la qualité de vie et l’Echelle Gériatrique de Dépression.

Nous allons présenter chacune de ces évaluations dans la partie suivante.

IV.2.3.3.1 L’indicateur de santé perçue de Nottingham (ISPN) – Hunt et al., 1980 ; Bucquet et al.,

1990)

Cet outil validé par Hunt et ses collaborateurs en 1980 et adapté en français par des

chercheurs de l’INSERM (Bucquet et al., 1990) permet de construire un profil de santé perçue

rendant compte de la qualité de vie. Il se présente sous la forme de trente-huit questions abordant six thématiques en lien avec la santé : l’énergie, la douleur, les réactions émotionnelles, l’isolement social, la mobilité physique et le sommeil.

45

Chaque item se présente sous la forme d’une affirmation formulée à la première personne. Le répondant décide si oui ou non cet item rend compte de sa situation. A chaque item a été attribué un coefficient pondéré en fonction de la sévérité perçue de la situation présentée. Le total des coefficients de chaque dimension est égal à cent. L’examinateur code 1 si la réponse est « oui » et 0 si la réponse est « non ». Pour chaque dimension, le score total est obtenu en faisant la somme des produits. Chaque score est donc compris entre zéro et cent et correspond au degré de difficulté que le sujet perçoit dans le domaine particulier. Plus le score est élevé, plus la sévérité et le nombre de problèmes perçus est important.

La validation du questionnaire conduite par Hunt et ses collaborateurs en 1980, fut réalisée auprès d’un échantillon de personnes âgées réparties dans quatre groupes en fonction de leur niveau d’activité et de leur état de santé. Le groupe A fut composé d’hommes en bonne santé et participant à un programme de maintien en forme, le groupe B, d’individus hommes et femmes sans pathologie et se déclarant en bonne santé, le groupe C de personnes participant à des activités sociales organisées mais présentant un handicap physique, social ou affectif. Enfin le groupe D fut composé sur un modèle comparable à celui du groupe B à la différence que ces individus souffraient d’une maladie chronique affectant leur bien-être. Les résultats des groupes A et B (âgés de 60 à 78 ans), pour chacune des dimensions du questionnaire, furent évalués strictement inférieurs à dix, ceux des groupes C et D (âgés de 60 à 93 ans), toujours strictement supérieurs à dix sur un total de cent. Nous nous sommes appuyés sur cette valeur seuil pour notre analyse parce qu’elle semble permettre de dichotomiser les scores de manière à distinguer des états de santé satisfaisants, d’états pathologiques au sein de la population âgée.

Le questionnaire complet de l’ISPN est présenté à l’annexe 3

IV.2.3.3.2 L’Echelle Gériatrique de dépression (GDS) - Yesavage et al., 1983

Cette échelle largement utilisée par les cliniciens (Lacoste et Trivalle, 2005) évalue les manifestations de la dépression affectant spécifiquement la population âgée en évitant de questionner des problématiques somatiques pouvant porter à confusion. Elle se compose de trente items avec une modalité de réponse binaire en OUI/NON. La modalité de réponse à connotation dépressive varie en fonction de la formulation de l’item. On comptabilise un point si la réponse révèle un symptôme dépressif, sinon zéro. L’addition des points donne le score final.

Les normes, d’après la version originale de l’échelle de Yesavage et al. (1983) sont les

dépression modérée, et un score compris entre vingt et trente rend compte d’un état dépressif sévère. Nous avons réutilisé cette classification pour notre étude.

Le questionnaire complet du GDS est présenté à l’annexe 4

IV.2.3.3.3 The Short Form Health Survey (SF36) – Ware et Sherbourne, 1992; Leplege et al., 2001

Le MOS SF-3646 ou SF-36 est un questionnaire destiné à l’autoévaluation de la santé physique

et psychique. Il est issu de l’étude d’observation longitudinale MOS, réalisée auprès de 2546 patients

souffrant de pathologies diverses pendant quatre années consécutives (Ware et Sherbourne, 1992).

La version française, adaptée et validée par l’équipe du Dr Leplège (Leplège et al., 2001) est issue du

projet IQOLA47 qui a traduit et accommodé le SF-36 dans plus de quarante langues différentes. Il est

aujourd’hui l’un des instruments de mesure de la santé les plus utilisé au monde

(Delarocque-Astagneau et al., 2003).

Le SF-36, évalue au travers de trente-six items le bien-être perçu et l’impact de l’état de santé physique et psychique sur la vie quotidienne. Il se décompose en huit dimensions :

- PF : activité physique : Mesure les limitations des activités physiques telles que marcher,

monter des escaliers, se pencher en avant, soulever des objets et les efforts physiques importants et modérés.

- RP : limitations dues à l’état physique : Mesure l’intensité de la gêne dans les activités

quotidiennes, mesure les limitations de certaines activités ou la difficulté pour les réaliser.

- BP : douleurs physiques : Mesure l’intensité des douleurs et la gêne occasionnée

- GH : santé perçue : Auto-évaluation de la santé en général, résistance à la maladie

- VT : vitalité : Auto-évaluation de la vitalité, de l’énergie, de la fatigue

- SF : vie et relations avec les autres : Mesure les limitations des activités sociales dues aux

problèmes de santé physique et psychique

- RE : limitations dues à l’état psychique : Mesure la gêne due aux problèmes psychiques dans

les activités quotidiennes : temps passé au travail moins important, travail bâclé

- MH : santé psychique perçue : Auto-évaluation de la santé psychique : anxiété, dépression,

émotion

46 Medical Outcome Study Short Form 36 items health survey

47

Parmi ces huit dimensions, les quatre premières évaluent le domaine physique et les quatre autres le domaine psychique. Ces scores exploitables de manière indépendante peuvent aussi être agrégés pour former les scores composites de santé psychique (MCS) et de santé physique (PCS).

Différentes études sur la qualité de vie, réalisées en population générale, fixent des normes pour chaque dimension en fonction du pays de résidence, de l’âge, du sexe, de la catégorie socio-professionnelle, du niveau d’éducation etc. Pour la population française, nous nous sommes basées sur les données relatives à la population des plus de soixante-quinze ans, calculées à partir de

l’algorithme d’Emmanuel Ecosse, construit selon les pondérations de Leplège et al. (2001).

Le questionnaire complet du SF-36 est présenté à l’annexe 5