• Aucun résultat trouvé

Les proc´edures SAS d’analyse de donn´ees d’enquˆete Olivier Sautory

N/A
N/A
Protected

Academic year: 2022

Partager "Les proc´edures SAS d’analyse de donn´ees d’enquˆete Olivier Sautory"

Copied!
2
0
0

Texte intégral

(1)

Les proc´ edures SAS d’analyse de donn´ ees d’enquˆ ete

Olivier Sautory 1

1 D´epartement des m´ethodes statistiques, INSEE

Dans les proc´edures standard d’analyse statistique propos´ees par SAS (MEANS,FREQ,REG,LOGISTIC), l’inf´erence statistique est fond´ee sur l’hypoth`ese que les donn´ees sont issues d’une population in- finie par sondage al´eatoire simple. Ces proc´edures peuvent donc ne pas ˆetre adapt´ees `a l’analyse de donn´ees recueillies par des enquˆetes par sondage probabiliste.

Les proc´eduresSURVEYMEANS,SURVEYFREQ,SURVEYREG, SURVEYLOGISTIC, qui seront pr´esent´ees dans l’atelier, permettent de mettre en oeuvre les m´ethodes classiques d’analyse en tenant compte du plan d’´echantillonnage mis en oeuvre : sondage stratifi´e, `a plusieurs degr´es, `a probabilit´es in´egales, avec des m´ethodes d’estimation de variance fond´ees sur des d´eveloppements de Taylor.

Plan de l’atelier

1. La proc´edure SURVEYMEANS permet de calculer des estimateurs de totaux, de moyennes, de proportions, de ratios, ainsi que les estimateurs de variance associ´es ; elle permet aussi de r´ealiser des estimations par domaine.

2. La proc´edureSURVEYFREQ permet d’estimer des effectifs de modalit´es de variables cat´ego- rielles, et des proportions, ainsi que les estimateurs de variance associ´es, dans des tableaux simples ou `a plusieurs entr´ees ; elle r´ealise ´egalement des tests d’ajustement `a une loi et des tests d’ind´ependance entre variables.

3. La proc´edure SURVEYREG permet de mettre en oeuvre des m´ethodes de r´egression lin´eaire (avec la possibilit´e d’introduire des variables explicatives cat´egorielles en utilisant la mˆeme syntaxe que dans GLM) : estimation des coefficients de la r´egression, de leur matrice de variance-covariance, test d’hypoth`ese sur les effets, sur les param`etres, etc.

4. La proc´edure SURVEYLOGISTIC permet de mettre en oeuvre des m´ethodes de r´egression logistique (avec la possibilit´e d’introduire des variables explicatives cat´egorielles), avec plusieurs fonctions de lien possibles : estimation des coefficients de la r´egression par la m´ethode du maximum de vraisemblance, de leurs variances, calcul des odds- ratios, etc.

Des exemples d’utilisation de ces proc´edures seront pr´esent´es en atelier.

1

(2)

Bibliographie

[1] Binder, D. A. (1983). On the Variances of Asymptotically Normal Estimators from Complex Surveys, International Statistical Review, 51, pp. 279-292.

[2] Fuller, W. A. (1975). Regression Analysis for Sample Survey, Sankhya, 37, Series C, pp.

117-132.

[3] Roberts, G., and Rao, J. N. K., and Kumar, S. (1987). Logistic Regression Analysis of Sample Survey Data, Biometrika, 74, pp. 1-12.

[4] Skinner, C. J., and Holt, D., and Smith, T. M. F. (1989). Analysis of Complex Surveys, New York, Wiley.

[5] Woodruff, R. S. (1971). A Simple Method for Approximating the Variance of a Complicated Estimate, Journal of the American Statistical Association, 66, pp. 411-414.

2

Références

Documents relatifs

[r]

Une exp´ erience par coloration a montr´ e qu’une rivi` ere souterraine alimente une r´ esurgence dans la vall´ ee. La rivi` ere souterraine a un d´ ebit tr` es sensible aux

Pour tester si les observations suivent une loi donn´ ee, pour comparer des moyennes, pour comparer des taux, si les observations sont issues d’une mˆ eme distribution, etc...

a - Calculer pour chaque sou-espace la performance moyenne et enregistrer le r´ esultat dans un data frame (utiliser summaryBy si possible).. b - Rep´ erer les 3 sous-espaces les

c - Comparer de nouveau, ` a l’aide d’un test statistique, les moyennes des 4 s´ eries de donn´ ees ` a partir de sous-´ echantillons al´ eatoires de taille 30. Exercice 4 :

Pour tester si les observations suivent une loi donn´ ee, pour comparer des moyennes, pour comparer des taux, si les observations sont issues d’une mˆ eme distribution, etc...

Pour revenir `a notre ´etude, `a partir de chaque mod`ele propos´e dans le paragraphe pr´ec´edent, nous pouvons rechercher les g`enes diff´erentiellement exprim´es entre les

Interrogeons nous maintenant sur la fa¸con dont sont construits ces tests multidimensionnels, autrement dit sur la fa¸con dont sont obtenues les matrices E pour les erreurs du