• Aucun résultat trouvé

Analyse statistique de données qualitatives et quantitatives en sciences sociales TP

N/A
N/A
Protected

Academic year: 2022

Partager "Analyse statistique de données qualitatives et quantitatives en sciences sociales TP"

Copied!
2
0
0

Texte intégral

(1)

Analyse statistique de données qualitatives et quantitatives en sciences sociales TP – exercices sur le chapitre 3

I. RÉGRESSION LOGISTIQUE POLYTOMIALE Le modèle

- Variable réponse X (I catégories)

- Variables explicatives : Y (J catégories) et Z (K catégories)

 choix des références pour i, j et k (I-1) régressions :

log 𝐶𝑜𝑡𝑒(𝑋 = 𝑖|𝑌 = 𝑗, 𝑍 = 𝑘) = 𝜇(𝑖)+ 𝛼𝑗(𝑖)+ 𝛽𝑘(𝑖)+ 𝛾𝑗𝑘(𝑖) avec 𝛼1(𝑖)= 𝛽1(𝑖)= 𝛾1𝑘(𝑖)= 𝛾𝑗1(𝑖)= 0 Etapes de l’analyse

1) Procéder à la sélection du modèle (uniquement sur base du type 3 avec « proc logistic ») 2) Interpréter les coefficients du modèle retenu

NB : Equivalents des coefficients dans le modèle de régression log-linéaire saturé : 𝛼𝑗(𝑖)= 𝜆𝑖𝑗𝑋𝑌 ; 𝛽𝑘(𝑖)= 𝜆𝑖𝑘𝑋𝑍 ; 𝛾𝑗𝑘(𝑖)= 𝜆𝑖𝑗𝑘𝑋𝑌𝑍 Le code SAS

proc logistic data = SAS-dataset;

class Y (ref = 'ref') Z (ref='ref')/param = ref;

model X (ref = 'ref’)= Y Z Y*Z/link = glogit;

run;

Exercice

Refaites l’analyse de la table 4x2x3 (Evaldemo4 (X) , polintr2 (Y), reg3 (Z) – dernier exercice du TP sur le chapitre 2) au moyen d’un modèle de régression logistique polytomiale plutôt que log-linéaire, en limitant l’analyse aux références suivantes :

- Evaldemo4 : « Very democratic » - Polintr2 : « Interested »

- Reg3 : « Wal »

Vérifiez que les estimations obtenues sont bien les mêmes qu’en régression log-linéaire.

Présentez les résultats dans un rapport pdf (avec titres adéquats, etc.).

(2)

II. MODÈLE À COTES PROPORTIONNELLES Le modèle

Variable réponse X ordinale

log 𝐶𝑜𝑡𝑒(𝑋 ≤ 𝑖|𝑌 = 𝑗, 𝑍 = 𝑘) = 𝜇𝑖+ 𝛼𝑗+ 𝛽𝑘+ 𝛾𝑗𝑘 avec 𝛼1= 𝛽1 = 𝛾1𝑘 = 𝛾𝑗1= 0 Etapes de l’analyse

1) Procéder à la sélection du modèle (cf. démo réalisée durant le TP) 2) Interpréter les coefficients du modèle retenu

NB : les paramètres s’interprètent indépendamment de i, ce qui simplifie considérablement l’interprétation des effets si cette hypothèse est raisonnable (d’où l’intérêt d’une démarche consistant à partir d’un tel modèle – simple – pour sélectionner les explicatives pertinentes puis d’affiner l’examen des effets au moyen d’une régression logistique polytomiale, par exemple).

Le code SAS

proc logistic data = SAS-dataset;

class Y Z(ref="ref") / param=ref ref=first;

model X = Y Z Y*Z / expb clparm=both;

run;

OU

proc genmod data = SAS-dataset;

class Y Z(ref="ref") / param=ref ref=first;

model X = Y Z Y*Z /dist=mult type1 type3;

run;

Exercice

Au terme de la démonstration sur la sélection des explicatives (réalisée avec la proc genmod), nous avons obtenu un modèle final avec 5 variables explicatives (reg3 educ3 plinsoc3 polintr2 hincfel) et 3 termes d’interactions (plinsoc3*hincfel polintr2*hincfel reg3*plinsoc3).

Ajustez ce modèle au moyen de la proc logistic, en prenant pour référence : - Reg3 : « Wal »

- Educ3 : « Middle » - Plinsoc3 : « Middle » - Polintr2 : « Interested »

- Hincfel : « Coping on present income »

Intreprétez les paramètres. Quels sont les constats principaux qui se dégagent de cette analyse globale ?

Références

Documents relatifs

Coder une variable quantitative d'une part, pose des problèmes de codage, choix de la partition, etc.. ; d'autre part entraîne une perte d'information. Mais surtout, on a bien mis

- On connaît la date d'inscription de l'élève à chaque atelier de loisirs et la salle dans laquelle se déroule l'atelier.. - Un atelier de loisir est encadré par un et un

En rapport avec cette thématique, vous choisirez une à deux variables réponses qualitatives ( : il faut impérativement une ordinale parmi elles) et une dizaine d’explicatives ( :

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP. IMPORTATION, PRÉPARATION DES DONNÉES, RAPPORTS ET MISE

- Si les deux explicatives ont un effet significatif, on conserve ce modèle pour interpréter les paramètres; sinon, on reteste l’effet de chaque explicative séparément

• Tous les intervalles pour les RC ne contenant pas 1 et étant > 1, on en déduit que la cote de succès est d’autant plus grande que le niveau d’éducation est faible (rappel

 Modèle d’indépendance : le nombre de personnes attendues en moyenne dans la cellule (i,j) ne dépend que des marges de la table de contingence :

Conclusion : pour une niveau d’intérêt pour la politique donné, les Wallons et les Flamands se distinguent systématiquement par rapport au choix de la catégorie « très