• Aucun résultat trouvé

Imputer ou ne pas imputer des valeurs probables aux données manquantes: Le case de l'Indice de sévérité du jeu excessif. Colloque Pour les jeunes chercheurs, Université McGill, février 2007

N/A
N/A
Protected

Academic year: 2021

Partager "Imputer ou ne pas imputer des valeurs probables aux données manquantes: Le case de l'Indice de sévérité du jeu excessif. Colloque Pour les jeunes chercheurs, Université McGill, février 2007"

Copied!
31
0
0

Texte intégral

(1)

Colloque Jeunes chercheurs CIQSS

Colloque Jeunes chercheurs CIQSS

-

-

F

F

é

é

vrier 2007

vrier 2007

Imputer ou ne pas imputer des valeurs

Imputer ou ne pas imputer des valeurs

probables aux donn

probables aux donn

é

é

es manquantes.

es manquantes.

Le cas de l'indice de s

Le cas de l'indice de s

é

é

v

v

é

é

rit

rit

é

é

du jeu pathologique

du jeu pathologique

Aline Drapeau

Aline Drapeau

Richard Boyer

Richard Boyer

G

(2)

Pourquoi se pr

Pourquoi se pr

é

é

occuper des valeurs manquantes?

occuper des valeurs manquantes?

„

„

Diminution de l

Diminution de l

’é

’é

chantillon

chantillon

Diminution de la puissance statistique

Diminution de la puissance statistique

Diminution de la pr

Diminution de la pr

é

é

cision

cision

„

(3)

Dans l

Dans l

ESCC

ESCC

-

-

1.2,

1.2,

(cycle 1.2 Enquête sur la sant

(cycle 1.2 Enquête sur la santéé dans les collectivitdans les collectivitéés canadiennes)s canadiennes)

24% des r

24% des r

é

é

pondants ont une valeur manquante

pondants ont une valeur manquante

pour l

pour l

indice de gravit

indice de gravit

é

é

des probl

des probl

è

è

mes de jeu

mes de jeu

Ç

(4)

Pourquoi

Pourquoi

?

?

„

„

Ils ont r

Ils ont r

é

é

pondu spontan

pondu spontan

é

é

ment qu

ment qu

ils n

ils n

’é

’é

taient pas

taient pas

des parieurs

des parieurs

à

à

la question

la question

Au cours des 12 derniers mois, combien de fois

Au cours des 12 derniers mois, combien de fois

avez

avez

-

-

vous pari

vous pari

é

é

ou d

ou d

é

é

pens

pens

é

é

plus d

plus d

argent

argent

au jeu que vous en aviez l

au jeu que vous en aviez l

intention?

intention?

„

„

Connotation n

Connotation n

é

é

gative du mot

gative du mot

parieur

parieur

?

?

Risque de biais de s

(5)

Indice canadien de jeu excessif (ICJE)

Indice canadien de jeu excessif (ICJE)

D

D

é

é

finition du jeu excessif:

finition du jeu excessif:

Le jeu excessif est un comportement li

Le jeu excessif est un comportement li

é

é

au jeu qui

au jeu qui

entra

entra

î

î

ne des cons

ne des cons

é

é

quences n

quences n

é

é

gatives tant pour le

gatives tant pour le

joueur lui

joueur lui

-

-

même que pour les personnes de

même que pour les personnes de

son r

son r

é

é

seau social ou pour la collectivit

seau social ou pour la collectivit

é

é

(Ferris et Wynne, 2001)

(6)

Indice canadien de jeu excessif (ICJE)

Indice canadien de jeu excessif (ICJE)

(Ferris/Wynne, 2001)

(Ferris/Wynne, 2001)

Adaptation de l

Adaptation de l

ICJE pour l

ICJE pour l

ESCC

ESCC

-

-

1.2

1.2

(1)

(1)

Activit

Activit

é

é

s de jeu

s de jeu

Fr

Fr

é

é

quence

quence

13 items

13 items

Co

Co

û

û

t

t

1 item

1 item

(2)

(2)

Gravit

Gravit

é

é

des probl

des probl

è

è

mes de jeu

mes de jeu

9 items

9 items

(3)

(3)

Corr

Corr

é

é

lats

lats

Ant

Ant

é

é

c

c

é

é

dents familiaux

dents familiaux

1 item

1 item

Association alcool/drogue

(7)

Mesure des activit

Mesure des activit

é

é

s de jeu dans l

s de jeu dans l

ESCC

ESCC

-

-

1.2

1.2

„

„ 13 items de fré13 items de fréquencequence

: loterie quotidienne/instant : loterie quotidienne/instant : autre loterie (6/49; fonds) : autre loterie (6/49; fonds)

: bingo : bingo

: jeux de cartes (argent) : jeux de cartes (argent)

: loterie vid

: loterie vidééo hors casinoo hors casino : loterie vid

: loterie vidééo au casinoo au casino : poker, roulette au casino : poker, roulette au casino

: Internet ou arcade : Internet ou arcade : course de chevaux : course de chevaux : loterie sportive : loterie sportive : Bourse, actions : Bourse, actions : jeux d

: jeux d ’’habiletéhabiletéss : autres

: autres

„

„ 8 choix de ré8 choix de réponseponse

: Tous les jours : Tous les jours : 2 : 2--6 fois/semaine6 fois/semaine : 1 fois/semaine : 1 fois/semaine : 2 : 2--3 fois/mois3 fois/mois : 1 fois/mois : 1 fois/mois : 6

: 6--11 fois/ann11 fois/annééee : 1

: 1--5 fois/ann5 fois/annéeée : Jamais

: Jamais

„

„ 1 item de coû1 item de coûtt

(6 cat

(6 catéégories: 1 gories: 1 àà 1000$)1000$)

„

(8)

É

É

valuation de la gravit

valuation de la gravit

é

é

des probl

des probl

è

è

mes de jeu:

mes de jeu:

9 items

9 items

Comportements probl

Comportements probléématiquesmatiques : D

: Déépenser + pour même excitationpenser + pour même excitation : Rejouer pour se refaire

: Rejouer pour se refaire

: Emprunter ou vendre des biens : Emprunter ou vendre des biens : Penser qu

: Penser qu’’on a un problèon a un problème de jeume de jeu : Parier plus qu

: Parier plus qu’’on peut se permettreon peut se permettre Cons

Conséquences néquences néégativesgatives : Probl

: Problèèmes de santmes de santéé : Être critiqu

: Être critiquéé : Probl

: Problèèmes financiersmes financiers : Sentiment de culpabilit : Sentiment de culpabilitéé

„

„ 4 choix de r4 choix de réponseéponse

: Jamais : Jamais : Quelques fois : Quelques fois : Plupart du temps : Plupart du temps : Presque toujours : Presque toujours „

„ Score potentiel 0-Score potentiel 0-2727

„

„ PéPériode de riode de

r

rééfféérence : 1 anrence : 1 an

„ Question-filtre:

(9)

Six cat

Six cat

é

é

gories de joueur bas

gories de joueur bas

é

é

es sur l

es sur l

indice de

indice de

gravit

gravit

é

é

des probl

des probl

è

è

mes de jeu (IGPJ)

mes de jeu (IGPJ)

Échantillon total

(n = 36 984)

Non joueurs

Joueurs

Non

(10)

Six cat

Six cat

é

é

gories de joueur bas

gories de joueur bas

é

é

es sur l

es sur l

indice de

indice de

gravit

gravit

é

é

des probl

des probl

è

è

mes de jeu (IGPJ)

mes de jeu (IGPJ)

o

o Non joueursNon joueurs (n = 8930)(n = 8930)

Aucune activit

Aucune activitéé de jeu de hasard dans les 12 derniers moisde jeu de hasard dans les 12 derniers mois

o

o Joueurs non problJoueurs non probléématiques selon matiques selon StatCanStatCan (n = 17225)(n = 17225)

R

Réépondu pondu àà ll ’’ IGPJ et obtenu un score de 0 àIGPJ et obtenu un score de 0 à IGJPIGJP Pas r

Pas réépondu pondu àà IGPJ (Parier 5 fois ou moins/annéIGPJ (Parier 5 fois ou moins/année/activite/activitéé))

o

o Risque faibleRisque faible ((

Score de 1 ou 2

Score de 1 ou 2

à

à

IGPJ

IGPJ

) (n = 1032)) (n = 1032)

o

o Risque modRisque modéérréé ((

Score de 3

Score de 3

à

à

7

7

à

à

IGPJ

IGPJ

) (n = 551)) (n = 551)

o

o Risque Risque éélevlevéé ((

Score de 8 et plus

Score de 8 et plus

à

à

IGPJ

IGPJ

) (n = 174)) (n = 174)

o

o Non parieurs autoNon parieurs auto--ddééclarclaréés s (n = 8962)(n = 8962)

Pari

Pariéé plus de 5 fois/annplus de 5 fois/annéée/activite/activitéé R

(11)

Indice de gravit

Indice de gravit

é

é

des probl

des probl

è

è

mes de jeu

mes de jeu

Distribution initiale

Distribution initiale

Joueurs non problémat. 46% Risque faible 2,7% Non joueurs (StatCan) 25% Non parieurs (auto) 24% Risque élevé 0,5% Risque modéré 1,5%

(12)

Indice de gravit

Indice de gravit

é

é

des probl

des probl

è

è

mes de jeu

mes de jeu

Distribution initiale d

Distribution initiale d

é

é

cortiqu

cortiqu

é

é

e

e

Non joueurs 25% Joueurs NP IGPJ Non répondu 21% Joueurs NP IGPJ Répondu 25% Risque élevé 0,5% Risque faible 2,7% Risque modéré 1,5% Non parieurs (auto) 24%

(13)

Que faire avec les 24% de r

Que faire avec les 24% de r

é

é

pondants

pondants

qui ont d

qui ont d

é

é

clar

clar

é

é

ne pas être des parieurs

ne pas être des parieurs

et qui ont une valeur manquante

et qui ont une valeur manquante

à

à

l

l

IGPJ?

IGPJ?

„

„ ScScéénario # 1 nario # 1 Aucune imputationAucune imputation

Respect des limites des donn Respect des limites des donnééeses Perte de puissance statistique Perte de puissance statistique Biais de s

Biais de séélectionlection

„

„ ScScéénario # 2nario # 2 Imputation Imputation StatCanStatCan

Non parieurs auto

Non parieurs auto-d-dééclarclaréés = classs = classéés JNPs JNP Art

Artééfact mfact mééthodologique?thodologique? Comparabilit

Comparabilitéé des donndes donnéesées

„

„ ScScéénario # 3nario # 3 Imputation de valeurs probablesImputation de valeurs probables

Art

Artééfact mfact mééthodologique?thodologique? Plus valide que l

Plus valide que l’’imputation StatCanimputation StatCan?? Perte de comparabilit

(14)

Qui sont ces non

(15)

Cat

Cat

é

é

gories de joueurs selon le groupe d

gories de joueurs selon le groupe d

âge (%)

âge (%)

9 4 14 63 20 7 19 65 8 4 11 63 22 19 16 55 0 20 40 60 80 100

15-19 ans 20-29 ans 30-64 ans 65 ans + JNP (StatCan) Nul/Faible Modéré/Élevé NP (Auto)

(16)

Cat

Cat

é

é

gories de joueurs selon le sexe (%)

gories de joueurs selon le sexe (%)

59 41 50 50 43 57 54 46 0 20 40 60 80 100 Femmes Hommes

(17)

Cat

Cat

é

é

gories de joueurs selon le pays de naissance

gories de joueurs selon le pays de naissance

(%)

(%)

85 15 87 13 89 11 86 14 0 20 40 60 80 100 Canada Autre

(18)

Cat

Cat

é

é

gories de joueurs selon l

gories de joueurs selon l

occupation (%)

occupation (%)

Emploi + Études 7% 6% 6% 14% JNP (S tatCan ) Nul/f aible Modér é/élev é NP (a uto) 1 Etudes 1% 1% 1% 3% JNP (St atCan ) Nul/f aible Modé ré/é levé NP (a uto) Emploi 63% 68% 74% 66% JNP (S tatCan ) Nul/fa ible Modér é/élev é NP (auto ) Aucun 20% 25% 19% 27% JNP (S tatCa n) Nul/f aible Modé ré/é levé NP (a uto)

(19)

Cat

Cat

é

é

gories de joueurs selon le statut marital (%)

gories de joueurs selon le statut marital (%)

Marié/Union libre 58% 44% 56% 51% JNP (S

tatCan)Nul/Faible Modér é/Élev é NP (A uto) Veuf Séparé Divorcé 23% 20% 22% 18% JNP (S

tatCan)Nul/Faible Modér é/Élev é NP (A uto) Célibataire 20% 36% 22% 31% JNP (S

tatCan)Nul/Faible Modér

é/Élev é NP (A

(20)

Cat

Cat

é

é

gories de joueurs selon le revenu du

gories de joueurs selon le revenu du

m

m

é

é

nage (%)

nage (%)

13 87 12 88 19 81 13 87 0 20 40 60 80 100 Faible Modéré

(21)

Cat

Cat

é

é

gories de joueurs selon la r

gories de joueurs selon la r

é

é

sidence (%)

sidence (%)

79 20 79 21 82 18 75 25 0 20 40 60 80 100 Urbaine Rurale

(22)

Bref,

Bref,

„

NP (Auto) vs. JNP (StatCan)

Plus âgés

Plus d’hommes (Moins de femmes)

Moins Emploi+Études; Plus Ni emploi+Ni études

Plus Mariés/union libre; Moins Célibataires

„

NP (Auto) vs. Nul/Faible

Profil similaire

„

NP (Auto) vs. Modéré/Élevé

(23)

Probl

Probl

è

è

me

me

On ne peut pas utiliser des variables associ

On ne peut pas utiliser des variables associ

é

é

es aux

es aux

probl

probl

è

è

mes de jeu pour imputer des valeurs

mes de jeu pour imputer des valeurs

probables aux donn

probables aux donn

é

é

es manquantes

es manquantes

à

à

l

l

IGPJ

IGPJ

et ensuite

et ensuite

é

é

tudier l

tudier l

influence de ces variables

influence de ces variables

sur le risque d

(24)

Strat

Strat

é

é

gie

gie

adopt

adopt

é

é

e

e

„

„

Hypoth

Hypoth

è

è

se : Le risque augmente avec la dose

se : Le risque augmente avec la dose

„

„

M

M

é

é

thode

thode

Mod

Mod

è

è

le pr

le pr

é

é

dictif bas

dictif bas

é

é

sur les activit

sur les activit

é

é

s de jeu

s de jeu

É

É

chantillon: R

chantillon: R

é

é

pondants qui ont r

pondants qui ont r

é

é

pondu

pondu

à

à

l

l

IGPJ

IGPJ

Variable d

Variable d

é

é

pendante

pendante

: IGPJ

: IGPJ

Variables ind

Variables ind

é

é

pendantes: Fr

pendantes: Fr

é

é

quence du jeu

quence du jeu

„

„

S

S

é

é

lection du mod

lection du mod

è

è

le qui maximise la classification

le qui maximise la classification

correcte des r

correcte des r

é

é

pondants

pondants

à

à

l

l

IGPJ

IGPJ

„

(25)

Cat

Cat

é

é

gories de joueurs selon qu

gories de joueurs selon qu

ils jouent ou

ils jouent ou

non 2

non 2

à

à

6 fois (ou plus) par semaine (%)

6 fois (ou plus) par semaine (%)

0 24 76 43 57 16 84 0 20 40 60 80 100 Oui Non

(26)

Pr

Pr

é

é

diction de l

diction de l

IGPJ

IGPJ

à

à

partir des 13 activit

partir des 13 activit

é

é

s de

s de

jeu (n = 11 183 r

jeu (n = 11 183 r

é

é

pondants

pondants

à

à

l

l

IGPJ)

IGPJ)

ƒ

Régression linéaire - Méthode Stepwise (19% var.)

IGPJ =

.005 + .547 Vidéo hors casino

+ .393 Autre jeu casino

+ .160 Vidéo au casino

+ .112 Bingo

+ 133 Loterie sportive

+ .054 Loterie instantanée

+ .113 Courses

+ .081 Investissement

-.019 Loterie type 6-49

(27)

Comparaison des valeurs pr

Comparaison des valeurs pr

é

é

dites vs. observ

dites vs. observ

é

é

es

es

Valeurs prédites

Valeurs

observées

JNP

Risque

faible

modéré

Risque

Risque

élevé

JNP

6982

2271

172

0

Risque

faible

347

545

124

0

Risque

modéré

106

298

138

0

Risque

élevé

21

90

88

1

(28)

Performance du mod

Performance du mod

è

è

le pr

le pr

é

é

dictif de l

dictif de l

IGPJ par

IGPJ par

cat

cat

é

é

gorie de joueurs

gorie de joueurs

Sous-estimation

Correcte

estimation

Sur-JNP (StatCan)

-

74,0%

26,0%

Risque faible

34,2%

53,6%

12,2%

Risque modéré

74,5%

25,5%

(29)

-Distribution (%) des cat

Distribution (%) des cat

é

é

gories de joueurs

gories de joueurs

selon le traitement des donn

selon le traitement des donn

é

é

es manquantes

es manquantes

Sans

imputation

Imputation

Statcan

Imputation

Régression

Non Joueurs

24,6

24,6

24,6

JNP (StatCan)

46,4

70,4

65,4

Risque faible

2,7 2,7 7,5

Risque modéré

1,5 1,5 1,6

Risque élevé

0,5

0,5

0,5

Non parieurs

(auto-déclarés)

24,3 - -

(30)

Association

Association

de IGPJ

de IGPJ

avec les facteurs classiques

avec les facteurs classiques

(

(

Β

Β

r

r

é

é

gression multiple excluant les non joueurs)

gression multiple excluant les non joueurs)

Sans

imputation

Imputation

Statcan

Imputation

Régression

constante .495 .580 .667

Age .046

.047

.032

Sexe .075

.058

.068

Emploi/Études -.028 (ns)

-.041

-.045

Emploi seul.

.155 .121 .127

Études seul.

-.234

-.242

-.279

Détresse psy.

.011 .008 .008

(31)

Alors, qu

Alors, qu

est

est

-

-

ce qu

ce qu

on a fait?

on a fait?

„

„ ScéScénario # 2nario # 2 Imputation StatCanImputation StatCan

Non parieurs auto

Non parieurs auto-d-dééclarclaréés = classs = classéés JNPs JNP

Parce que ..

Parce que ..

Comparabilit

Comparabilitéé des donnédes donnéeses Maximise taille de l

Maximise taille de l’é’échantillonchantillon Mod

Modèèle prle préédictif explique 19% de la variance IGPJdictif explique 19% de la variance IGPJ Classification correcte faible pour joueurs

Classification correcte faible pour joueurs àà risque modérisque modérréé//élevélevéé

MAIS

MAIS ……

Classification erron

Classification erronéée potentielle (e potentielle (≈≈ 5 %)5 %) Impact sur les r

Références

Documents relatifs

LES 5 MOTS PERDUS - LA FLEURISTE une étoile une orange. du lait

Par ailleurs, il faut noter que l’approche est dif- ficilement praticable lorsque certaines variables ont un fort ratio de manquants (les mod`eles de r´egression, dont la

´ elev´ es, leur ajoutent des am´ eliorations, et l’introduction d’un « effet qualit´ e » abaissant leurs prix ` a l’ann´ ee cible accroˆıt la diminution de prix,

[r]

dimanche les vacances une branche des chansons un chanteur la grand-mère le grand-père un pantalon une plante ma tante une orange. Attention aux

dimanche les vacances une branche des chansons un chanteur la grand-mère le grand-père un pantalon une plante ma tante une orange.. Attention aux

vous mangez vous sautez vous parlez un cahier. manger sauter

Cette semaine, j’ai une écharpe sur le nez car il ne fait pas assez chaud. Le méchant loup mange le