• Aucun résultat trouvé

Package CPMCGLM : Correction de la pvaleur engendré par la recherche d'un codage d'une variable explicative dans un modèle linéaire généralisé

N/A
N/A
Protected

Academic year: 2021

Partager "Package CPMCGLM : Correction de la pvaleur engendré par la recherche d'un codage d'une variable explicative dans un modèle linéaire généralisé"

Copied!
3
0
0

Texte intégral

(1)

HAL Id: hal-00717504

https://hal.archives-ouvertes.fr/hal-00717504

Submitted on 13 Jul 2012

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Package CPMCGLM : Correction de la pvaleur engendré

par la recherche d’un codage d’une variable explicative

dans un modèle linéaire généralisé

Jeremie Riou, Benoit Liquet

To cite this version:

Jeremie Riou, Benoit Liquet. Package CPMCGLM : Correction de la pvaleur engendré par la recherche d’un codage d’une variable explicative dans un modèle linéaire généralisé. 1ères Rencontres R, Jul 2012, Bordeaux, France. �hal-00717504�

(2)

Package CPMCGLM : Correction de la pvaleur engendré par la recherche d’un codage d’une variable explicative dans un modèle linéaire généralisé

J. Rioua,b

and B. Liquetb a

Equipe Biometrie Danone Research

RD 128, Avenue de la Vauve, 91767 Palaiseau Cedex, FRANCE jeremie.riou@isped.u-bordeaux2.fr

b

Equipe Biostatistique ISPED

Université de Bordeaux - CR INSERM U897 146 rue Léo Saignat, 33076 Bordeaux Cedex, FRANCE

benoit.liquet@isped.u-bordeaux2.fr

Mots clefs : Procédure de Bonferroni, Modèles Linéaires Généralisés, Codages Multiples, Multiplicité des tests, Méthodes de rééchantillonage

Une pratique courante en modélisation consiste à transformer une variable quantitative en variable catégorielle. Cette transformation se base normalement sur des seuils scientifiquement reconnus. Mais, dans de nombreux cas, les seuils ne sont pas connus et il est nécessaire de déterminer le meilleur codage possible. Ce choix de codage, se fait en testant de nombreuses combinaisons de seuils jusqu’à obtenir la meilleure d’entre elle. Cette procédure entraîne un problème de multiplicité, nécessitant une correction de la pvaleur afin de ne pas surestimer

l’association entre la variable codée et la variable à expliquer.

C’est ce que propose de faire le package CPMCGLM dans le cadre de modèles linéaires généralisés. Les méthodes de corrections utilisées dans le package sont la procédure basée sur l’inégalité de Bonferroni, et des procédures de rééchantillonage. Ces dernières basées sur la permutation et le bootstrap paramétrique sont plus précises, puisqu’elles nous permettent de prendre en compte la corrélation qui existe entre les tests réalisés [1]. Une méthode de correction asymptotique-ment exacte est égaleasymptotique-ment utilisée dans le cadre de codage binaire, et/ou continu [2,3].

Dans le package, les transformations de Box-Cox, les transformations binaires, et les transfor-mations catégorielles sont disponibles. L’utilisateur peut soit rentrer les transfortransfor-mations qu’il veut utiliser, soit utiliser une des stratégies de codage disponibles. La fonction CPMCGLM() nous fournit en sortie le codage retenu, ainsi que les pvaleur ajustées et non ajustée correspondant à

ce codage. Références

[1] Liquet, B. and Riou, J. (2012). Correction of significance level after multiple coding in the Generalized Linear Model. [Soumis].

[2] Liquet, B. and Commenges, D. (2001). Correction of the p-value after multiple coding of an explanatory variable in logistic regression. Statistics in Medicine, 20 : 2815 − 2826.

[3] Liquet, B. and Commenges, D. (2005). Computation of the p-value of the minimum of score tests in the generalized linear model, application to multiple coding. Statistics & Probability Letters, 71 : 33 − 38.

(3)

Références

Documents relatifs

Chaque année, on considère que la population augmente du même nombre, donc on a faire à un modèle

Dans cette analyse, seul le facteur de rang 1 de chaque groupe explicatif a un effet partiel tr`es net sur le risque de divorce (cf. tableau 2, avec la mise en garde

cadre du modèle linéaire généralisé avec effets aléatoires a fait l’objet d’un certain nombre d’études assez récentes.. L’ensemble des méthodes développées

On montre que ce modèle peut être considéré comme un modèle linéaire généralisé et on étudie les propriétés asymptotiques des estimateurs du maximum de

Une analyse de la variance multivariée des composantes principales définies sur les profils-lignes sur les facteurs X1, ..., Xk permet de restituer les résultats

Afghanistan Angola Armenia Azerbaijan Bangladesh Belgium Bhutan Botswana Bulgaria Cambodia Cape Verde Chile Comoros Costa Rica Cuba Denmark Dominican Republic El Salvador

(e) Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

On parle alors de modèle linéaire gaussien... Donner la loi du