• Aucun résultat trouvé

Coefficient de Tschuprow partiel et indépendance conditionnelle

N/A
N/A
Protected

Academic year: 2022

Partager "Coefficient de Tschuprow partiel et indépendance conditionnelle"

Copied!
5
0
0

Texte intégral

(1)

Statistique et analyse des données

J. J D AUDIN

Coefficient de Tschuprow partiel et indépendance conditionnelle

Statistique et analyse des données, tome 4, no3 (1979), p. 55-58

<http://www.numdam.org/item?id=SAD_1979__4_3_55_0>

© Association pour la statistique et ses utilisations, 1979, tous droits réservés.

L’accès aux archives de la revue « Statistique et analyse des données » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commer- ciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impres- sion de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

COEFFICIENT DE TSCHUPROW PARTIEL ET INDEPENDANCE CONDITIONNELLE

J . J DAUDIN

Institut National Agronomique Paris Grignon Service de Mathématiques

16, rue Claude Bernard - 75005 PARIS Résume

Nous étudions les relations logiques entre indépendance conditionnelle et la nullité du coefficient de liaison partielle proposé par Saporta.

1 - RAPPEL DE LA DEFINITION DU COEFFICIENT DE TSCHUPROW PARTIEL

Soit X,Y,Z 3 variables aléatoires discrètes, à valeurs respectivement sur les ensembles [1,2,...1] , [ 1,2 . . J] et[ 1,2 , . . K]

Soit Pijk= P (X-in Y=jnz=k)

pi j .= k Pijk

et des définitions semblables pour p. , , p .. ,p . et p Soit» 2 - I. P i j'

XY ij p p

J. • • « J

2

*

2

- s

Pi

'

k

x z" ij P-- P k

2

• B île YZ jk p . p

• J • • . A.

soit enfin 2

T

= * ™ -t

XY

• ( i - i j U ' - i ) — . -*

1X Z "

T = YZ

/ li-j) lk-1)

* Y Z

/(J--1) U - l )

(3)

56

Tx est le carre du coefficient de Tschuprov qui est une mesure de la liaison entre X et Y.(voâr Kendall et Stuart tome 2 p«55T)

Saporta (1976) a montré que l'on peut définir * „v comme produit scalaire de 2 opérateurs. Comme les normes de ces 2 operateurs sont respectivement *tf>l et *Û"-I, T^y peut être défini comme le produit scalaire entre 2 opérateurs divi ses par le produit de leurs normes.

Cette propriété de Tx y qui en fait un indice de liaison entre variables discrètes analogue au coefficient de corrélation entre variables continues a conduit

Saporta a définir le coefficient Tx y z par analogie avec le coefficient de corrélation partiel.

T _ XY XZ XYZ XY, Z

^-

T

xz / ^ ¾

Saporta a proposé TX Y z comme indice de liaison partielle entre X et Y à Z fixé et l'a appelé coefficient de Tschuprov partiel, Il est naturel alors de yéri-,

fier si la nullité de ^XYtz c a r ac t é r i s e l'indépendance conditionnelle, c'est à dire si on obtient l'équivalence :

TX Y . Z= 0<* X , Y i n d éPe n (iantesà Z fixé.

En fait on va montrer que les 2 implications sont fausses.

2 - T XY.Z= ° e t N 0 N INDEPENDANCE CONDITIONNELLE

On considère la table suivante de probabilités (p..,) avec I=J=K=2

1 J K

k j

1 1 1 2 2 1 2 2

i=l i=2 1/U 1/12

0 1/6 (2 . • 1/6

1/U 1/2

Table 1 Les 3 marges de la table 1 sont :

j-l

i=l i=2 1/U 1/U j-2 ! 1/U l/U

T =0 iX Y u

z^"^\^

k=l k=2

i=l i = 2

1/U 1/U 1/U l/U T =0

X ^ Y Z ^ \

k=l

k = 2

j-l j-2

1/3 1/6 1/6 1/3

TYZ*°

(4)

Alors Tvv =0 tandis que

A I § Zi

, pi . ip. n _ i A . i / 3

'..1 1/2

- 1/6

Ce qui implique que X et Y ne sont pas indépendantes condit lonnellement à Z, Soit la table de probabilité suivante et ses marges :

1 1 1 2 2 1 2 2

i=l i=2 1/2 0 0 1/2 o 1/2 1/2 0

j-1 J-2

i-1 i*2 1/2 1/2 1/2 1/2

Ici k=2

1/2 1/2

1/2

1/2 k = 2

j-l J-2 1/2 1/2 1/2 1/2

On obtient T ^ z~° e^ pourtant la liaison entre "X et Y à 2 fixé est maximale puisque la connaissance de la valeur de X implique celle de Y.

Ces contres exemples indiquent que Tv v «=0 nf implique pas 1T indépendance condi- tionnelle et que on peut avoir à la fois Tv__ =0 et une dépendance entre X et Y

A l . Lx

1 Z fixé.

3- INDEPENDANCE CONDITIONNELLE ET Tx y %+ 0

On suppose que X et Y sont indépendantes condit ionnellement à Z. En fait on obtient alors T«v ^O que dans le cas particulier où K=2 .

A I . L

Dans le cas où 2;TvY Pe u t très différent de 0 comme on le voit sur 1 ' exemple suivant.

On considère la table de probabilité (X10) suivante : Table 2

j=l j=2

i=l i=2 2 1 0 0

k=l

i=l i=2 0 0 1 3

k=2

i«l i=2 2 1 0 0

k=3

Table 2

(5)

58

Les marges de la table 2 sont les suivantes :

X ^ \ ^ i = l

j «

i

k = l k = 2 k = 3

2 1 2

1 3 , 1 j=2

k=l k=2 3

0

0 h

k=3 3 0

X ^ J j = l o=2 i=l h 1 i = 2 1 3

On obtient Tx y =.322

T

xz

3

'

1 1 8

TÏ Z =.707

TX Y . Z='3 3 9

La nullité de Tvv „ pour K=2 provient de l'égalité connue 2 = 2 . 2

<fi ~" $ * $ XY XZ YZ

Remarquons pour conclure que la non vérification de l'implication Tv v „=0*> indépendance conditionnelle

A i • u

n'est pas tragique:

elle n'est pas non plus réalisée par le coefficient de corrélation pour des variables non gaussiennes.

Par contre la non vérification de l'implication indépendance conditionnelle*» T„ =0

nous semble plus grave et conduit à mettre en question l'utilisation de ce coefficient,

Je remercie G.Saporta et G,Drouet d'Aubigny pour leurs utiles remarques.

BIBLIOGRAPHIE

M.G. KENDALL, A.STUART. The advanced theory of statistics volume 2 Griffin 3eme édition G.SAPORTA (1976) "quelques applications des opérateurs d'Escoufier au

traitement des variables qualitatives" Bulletin de l'Association des Statisti- ciens Universitaires - 1er trimestre 1976, 38-U6.

Références

Documents relatifs

Le cercle de diamètre [AB] est l’ensemble des points M du plan tels que

Dans le cas de cette matrice carrée , si le rang est égal à la dimension de la matrice, alors cela signifie que les vecteurs issus des colonnes de la matrice sont

Un point M, distinct de A et B, appartient au cercle de diamètre [AB] si et seulement si le triangle ABM est rectangle en M. Produit scalaire dans un

Familles orthogonales et orthonorm´ ees ( par convention, le vecteur nul ne fait pas par- tie d’une famille orthogonale).. Une famille orthogonale

Méthode : Calculer un produit scalaire par projection Vidéo https://youtu.be/2eTsaa2vVnI.

Produit scalaire dans un repère orthonormé Le plan est muni d'un repère

L’intérêt de la projection orthogonale réside dans le fait qu’on obtient des vecteurs colinéaires pour lesquels le calcul du produit scalaire est beaucoup plus simple en

Dans chacun des cas, calculer le produit scalaire i.. Dans chacun des cas, calculer la mesure de I'angle