• Aucun résultat trouvé

Introduction à l’analyse des données en géographie (Cours 1) ME1AY030 Master Meci

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction à l’analyse des données en géographie (Cours 1) ME1AY030 Master Meci"

Copied!
45
0
0

Texte intégral

(1)

Introduction à l’analyse des données en géographie

(Cours 1)

ME1AY030

Master Meci

(2)

Statistiques

 Manière de structurer l’information

 Language universel

 Déf rigoureuses, terminologie précise

 Ensemble de données numériques concernant catégorie de faits

 Ens. de méthodes mathématiques permettant de résumer

l’information aux moyen d’une investigation exhaustive

(3)

Statistique Descriptive

 Pour étudier/comparer un grand nombre d’individus

 Construire une vision globale : un résumé, une information synthétique

 Appliquée ici à information quantitative (sf si ACM information qualit ; ou Logit)

 Décrire, Classer, Résumer, Hiérarchiser

 Rechercher des régularités, des spécificités

 ≠ stat explicative : tester des hypothèses (régression multiple, logit)

(4)

Statistique descriptive en géographie

 Permet la comparaison entre des individus statistiques, géographiques (ex ?)

 Travaille sur des agrégats de population ou individus

 Fournit les moyens de représenter graphiquement (et carto) l’information

 Décrire des phénomènes variables dans l’espace (et le temps)

 Guide l’interprétation en permettant de distinguer le gnl et le

particulier

(5)

Un espace, des individus « géographiques », une question

 Quelle question ? Quel espace ? Quels individus géo ?

 Quelles sources d’information ? Internationale / Générale /

spécialisée / officielle / ouverte / enquêtes …

(6)

Statistique descriptive en Géographie

 Délimiter l’espace d’étude

 Identifier le type d’individus à étudier : l’échelon d’observation auquel la question est pertinente

 Objectif : mise en valeur des différenciations et des similitudes dans l’espace étudié

 Information géographique : localisée, localisable =

composante spatiale ≠ composante sémantique

(7)

Population et individus en géographie

 Population : une collection d’individus statistiques formant un ensemble pertinent, voire un système. Ex ?

 Individus : les éléments de la population observée ; peuvent être des objets géographiques (localisables). Ex ?

 En géographie on parle parfois d’unité spatiale au sujet des individus

statistiques : les unités spatiales peuvent être de dimensions différentes

(grandes ou petites), d’implantations diverses (linéaires ou ponctuelles, ou

surfaciques)

(8)

Population et individus en géographie

Dumolard, 2003, p. 24

(9)

Population et individus en géographie

P o p u la ti o n in d iv id u s

Caractères

(10)

L’information sémantique associée aux individus

 Les caractères de la population : (les variables du tableau d’information géographique)

 Caractères : sont des propriétés communes à tous les individus de la population étudiée

 Caractères : ont des modalités : un ensemble de modalité

 Un individu = une modalité et une seule pour un caractère

 Tout individu a une modalité pour un caractère (sf valeurs

manquantes)

(11)

Caractères : qualitatifs ou quantitatifs

 Quantitatifs : modalités du caractère sont exprimées par des quantités issues d’une mesure ; elles se traduisent par des

nombres ; 2 modalités peuvent être comparées par un opérateur logique

 Quantitatif discret : il ne peut prendre que certaines valeurs isolées dans son intervalle de variation : par ex des nbres entiers

 Continu : le caractère peut prendre potentiellement toutes les valeurs à l’intérieur de son intervalle de variation. Ses valeurs peuvent être des nombres réels (IR ; décimaux)

 Qualitatifs : traduisent des états distincts ; ne peuvent être

comparés : sf si ordinaux ; mais peuvent aussi être analysés pour

la manière dont ils caractérisent une population. ex ?

(12)

 Quantitatifs continus

 Quantitatifs discrets

 Qualitatif nominal

 Qualitatif ordinal

Caractères : qualitatifs ou quantitatifs

Dumolard, 2003, p. 13

(13)

Tableau d’information géographique

Ex : La pollution par le NO2 dans les villes françaises en février 2001

LIBUU _01FEB _02FEB _03FEB _04FEB _05FEB _06FEB _07FEB _08FEB _09FEB _10FEB _11FEB

AMIENS 69,04 45,54 24,99 12,08 19,95 19,11 27,98 21,94 47,39 40,55 14,18

ANGERS 47,95 33,56 17,72 8,52 14,25 14,66 24,01 22,10 29,30 23,15 12,38

ANGOULEME 34,81 30,93 21,54 10,01 21,82 21,33 16,85 20,10 28,16 22,27 15,41

ANNECY 32,49 51,03 35,50 29,09 30,42 50,72 56,14 30,70 25,99 31,88 35,55

AVIGNON 27,46 44,13 74,84 38,97 56,65 28,15 13,14 28,26 31,95 19,84 50,43

BAYONNE 35,77 34,96 30,03 16,91 23,20 10,11 14,88 17,42 31,49 36,79 25,68

BESANCON 63,91 43,05 21,86 16,77 19,79 24,41 37,18 24,81 33,15 37,66 43,55

BETHUNE 73,15 64,16 30,85 13,24 20,92 19,12 32,89 21,23 41,85 45,03 14,95

BORDEAUX 38,01 43,41 21,03 21,75 35,43 34,90 33,85 32,35 36,50 31,61 21,83

BREST 31,25 39,07 18,46 11,97 19,15 19,38 30,15 35,88 38,53 19,79 11,98

CAEN 48,48 37,90 32,57 12,65 27,38 28,99 31,51 28,52 42,66 32,36 18,80

CHAMBERY 36,06 52,87 45,10 25,39 42,86 54,55 46,60 24,68 28,23 36,64 45,06

CLERMONT-FERRAND 37,78 51,26 27,61 15,45 20,86 24,88 16,36 24,07 18,43 37,74 41,42

DIJON 39,50 41,03 36,88 15,80 19,93 38,02 24,10 33,83 27,83 34,60 34,73

DOUAI-LENS 62,65 58,89 25,50 11,98 16,37 19,34 25,17 15,32 39,44 35,47 14,41

DUNKERQUE 76,97 59,79 48,03 20,70 24,29 25,26 37,68 30,14 44,03 48,38 12,36

GENEVE(CH)-ANNEMASSE (*) 27,67 52,89 31,84 23,16 26,71 43,18 44,59 29,40 31,89 38,33 42,66

GRENOBLE 45,84 57,26 70,32 47,67 57,78 36,12 11,23 24,28 37,81 38,77 45,34

LA ROCHELLE 40,05 36,80 20,82 9,35 19,34 20,91 23,46 25,32 30,42 25,30 18,28

LE HAVRE 70,94 39,25 26,92 13,50 22,58 21,88 34,73 25,66 43,00 39,84 19,46

LE MANS 53,84 50,90 30,71 15,47 31,21 27,53 34,40 39,12 49,58 39,05 24,58

LILLE (*) 72,63 62,24 37,92 21,23 26,69 29,56 33,78 24,71 49,59 43,91 19,77

LIMOGES 25,21 32,12 20,84 10,44 18,07 20,54 16,08 17,61 21,65 22,70 20,68

LORIENT 28,90 12,60 3,52 2,98 4,21 4,91 10,62 15,91 20,87 8,75 5,73

LYON 45,17 65,63 57,23 36,19 44,53 31,51 22,77 40,13 41,11 41,67 60,33

MARSEILLE-AIX-EN-PROVENCE 38,72 47,95 43,45 28,81 49,87 23,88 14,55 25,46 25,89 34,35 51,31

MAUBEUGE (*) 51,42 33,26 16,76 7,91 12,93 13,44 11,58 10,45 29,18 19,28 6,61

METZ 49,69 33,90 11,87 7,57 6,54 18,42 29,64 17,59 26,42 32,34 23,81

MONTBELIARD 49,38 38,54 19,18 18,22 15,20 32,97 61,98 35,67 27,38 39,03 37,80

Population ? Individus ? Caractères ?

(14)

L’information est organisée dans un tableau d’information géographique

Ex : La structure par âge des 22 (anciennes) régions françaises

CODE NOM POP0-14 POP15-19 POP20-39 POP40-59 POP60-74 POP75

11 ILE-DE-FRANCE 2061864 702129 3449572 2917322 1184257 635992

21 CHAMPAGNE-ARDENNE 244649 95517 376159 345501 180592 99784

22 PICARDIE 363283 136940 520921 481358 232499 122104

23 HAUTE-NORMANDIE 342479 131493 497555 461606 225002 122304

24 CENTRE 424802 162168 648196 635295 354570 214931

25 BASSE-NORMANDIE 257175 101280 380357 358847 209368 115409

26 BOURGOGNE 269450 105957 416690 420355 247663 150292

31 NORD-PAS-DE-CALAIS 805229 314019 1151043 976688 498126 250766

41 LORRAINE 416197 162588 652559 596537 325141 157001

42 ALSACE 316800 114780 517944 453425 223517 107266

43 FRANCHE-COMTE 202033 79369 309138 289786 153559 83372

52 PAYS DE LA LOIRE 585729 232937 890430 812542 446795 254351

53 BRETAGNE 501925 198368 783710 731423 444135 247617

54 POITOU-CHARENTES 262437 106133 421831 425894 262525 161633

72 AQUITAINE 463331 182687 771618 767228 448944 275145

73 MIDI-PYRENEES 402428 153963 692894 664828 394405 244178

74 LIMOUSIN 97837 40636 176856 186422 125363 83678

82 RHONE-ALPES 1045155 385633 1610746 1472678 730896 400739

83 AUVERGNE 199480 82219 341759 350524 210150 124524

91 LANGUEDOC-ROUSSILLON 379415 145851 603540 590557 358990 218004

93 PROVENCE-ALPES-COTE D'AZUR 765888 281571 1186481 1184529 675452 412332

94 CORSE 41753 15863 67741 70036 41267 23489

(15)

La source du tableau d’info géo : un tableau élémentaire

Ex : une enquête individuelle

CODE ag e se xe se rie ac t s al a co m de p T ra ns _T T ra ns _D T ra ns _M br u_ D ly o_ D ni c_ D or l_ D pr a_ D ba r_ D br u_ R ly o_ R ni c_ R or l_ R pr a_ R ba r_ R ab i_ C br a_ C bu c_ C ku a_ C

1 18 H es 2 75011 75 20 1,5 tc 400 400 700 180 1000 1000 n o n o o n AFR EUR EUR ASIE

2 18 H s 2 75009 75 30 7 tc 300 400 800 100 1000 1000 n o n n n AFR EUR EUR ASIE

3 18 F es 0 75020 75 40 2 tc 350 600 780 100 900 1000 n n n o n n EUR EUR EUR

4 18 H s 0 75011 75 30 tc 500 500 980 700 1600 1500 n o n n n o AFR EUR

5 18 H es 0 75018 75 40 tc 80 90 95 11 120 100 o n n n n n AFR EUR EUR ASIE

6 18 H es 0 91220 91 45 35 tc 200 450 800 n o n o n n AFR EUR

7 19 F es 3 91250 91 75 50 tc 1500 500 1100 150 2000 o o o o n n EUR

8 19 F l 0 75020 75 30 tc 800 500 950 150 1700 1100 AFR EUR EUR ASIE

9 19 H es 2 77176 77 75 50 tc 300 400 800 120 500 1200 AFR EUR AMER

10 19 F s 2 92350 92 45 30 tc 200 500 1000 100 700 1100 n o o o o o AFR EUR EUR ASIE

11 19 H l 0 78230 78 45 35 tc 600 600 980 400 1600 1500 n n o n n n AFR EUR

12 19 F s 0 94370 94 70 15 tc 300 700 900 150 1100 1200 n n n n n n AFR EUR

13 19 H es 0 93330 93 60 25 tc 400 500 700 150 600 1000 n n n o n n AFR EUR EUR AMER

14 19 F es 0 91260 91 45 20 tc 400 500 800 150 2500 1500 o o o n n n AFR EUR

15 20 F l 0 75010 75 35 10 tc 300 600 800 120 1500 1000 n o n o n o EUR EUR EUR AMER

16 20 H stt 2 93360 93 60 80 tc 400 300 800 130 1200 1100 o o n o n n AFR EUR EUR ASIE

17 20 H s 0 75001 75 15 2 v 500 450 800 100 1000 1000 o o n n n n AFR EUR

18 21 H l 3 92100 92 45 20 tc 350 600 750 750 1800 850 n n n n n n AFR EUR EUR ASIE

19 21 H s 3 75012 75 30 2 tc 400 700 1000 300 1500 2000 o o n o n n AFR EUR EUR OCEA

20 21 F es 2 94400 94 45 3 tc 300 400 750 150 2000 1500 n o n n n n AFR EUR EUR ASIE

21 21 F l 2 91160 91 60 25 tc 300 900 700 150 1700 1200 o o n n n o AFR EUR EUR AFR

22 21 H stl 2 75018 75 45 7,5 tv v 500 600 1000 100 2000 1400 n o o n n n AFR EUR

23 21 H s 0 95190 95 60 tc 250 400 1000 120 2500 1200 o o n o n n AFR EUR EUR AFR

24 22 H s 2 75012 75 20 5 tc 550 400 750 150 1400 950 n n n n n o AFR EUR EUR ASIE

25 22 H s 1 93500 93 70 7 tc 340 400 800 250 750 900 n o n n n n AFR EUR EUR ASIE

26 17 F s 0 75016 75 30 8 tc 300 400 700 200 1300 1200 o o n o n n AFR EUR EUR ASIE

27 18 F es 0 75019 75 45 15 300 500 850 100 1600 1200 n n n n n n AFR EUR ASIE

28 18 H l 0 92240 92 40 10 tc 450 500 800 300 1400 1300 n n n n n o ASIE EUR

29 18 F shs 2 75013 75 15 2 pied 300 450 700 1000 n n n n n n AFR ASIE EUR

30 18 H es 0 94500 94 50 16 tc 300 400 700 200 1500 900 n n n o n n EUR EUR ASIE

31 18 F es 0 91390 91 60 20 tc 320 500 800 130 1000 1400 n o o o n n AFR EUR ASIE

32 19 H s 0 77176 77 90 50 tc 250 450 600 90 1200 950 n n n o n n AFR EUR EUR ASIE

33 19 H es 2 77176 77 75 50 tc 500 450 920 200 700 1200 n o o o n n AFR EUR EUR

34 19 F l 0 75012 75 20 5 tc 350 500 750 200 900 1000 n o n n n n AFR

(16)

Résumer la distribution statistique d’un caractère : valeurs centrales et paramètres de dispersion

(cours 2)

(17)

Résumer et décrire la distribution statistique d’un caractère quantitatif

 Résumer l’ensemble des informations contenues dans le tableau d’information géographique à l’aide de quelques chiffres significatifs

 Les valeurs centrales

 Les paramètres de dispersion

(18)

Les valeurs centrales pour résumer le niveau d’une variable

 Le mode

 La moyenne

 La médiane

(19)

La moyenne arithmétique : C’est la somme des modalités adoptées par chaque individu de l’ensemble observé, rapporté au nombre d’individus. La moyenne arithmétique est fonction de toutes les observations mais est sensible aux valeurs extrêmes : c’est un indicateur peu robuste.

å =

= n

i

x i

x n

1

1

La moyenne : niveau élevé ou faible ?

(20)

 C’est la valeur la plus fréquente pour la distribution d’un caractère quantitatif discret

 c’est la classe correspondant au pic de l’histogramme pour une variable quantitative continue. Dans ce dernier cas, sa détermination est donc malaisée et dépend du découpage en classe .

Le mode : une valeur fréquente

(21)

 La médiane, notée Q2 est la modalité de la variable telle que la moitié des valeurs lui est inférieure et l’autre moitié supérieure (Dumolard et al, 2003, Les statistiques en géographie, p. 91).

 C’est la modalité d’un caractère qui partage la distribution statistiques en deux classes d’égales fréquences

La médiane : au centre de la distribution statistique

(22)

Propriétés des valeurs centrales

 Etre définie de façon objective : 2 personnes traitant la même information doivent trouver le même résultat

 Dépendre de tous les individus

 Avoir une signification concrète

 Etre simple à calculer

 Etre peu sensible aux fluctuations de l’ensemble observé

 Se prêter au calcul algébrique

(23)

Formes des distributions statistiques des caractères

 Comment se répartissent les individus observés dans l’ensemble des modalités possibles du caractère

 Distribution Symétrique

 Dissymétrique

 Bimodale

(24)

Distribution symétrique

 Moyenne = Médiane = Mode

 Une variante des distributions symétriques : les distributions gaussienne = loi normale.

Presque toutes les valeurs sont comprises entre la moyenne et + ou – 3 écart-type

Dumolard, 2003, p. 113

Grasland

(25)

Formes des distributions : dissymétrique

 A droite

 médiane > moyenne

 une grande partie des individus adoptent des modalités élevées

 A gauche

 médiane < moyenne

 une grande partie des individus adoptent des modalités faibles

Grasland

(26)

Formes des distributions : bimodale

 Mode 1 > Moyenne = Médiane > Mode 2

(27)

Le tableau d’information : pathologies respiratoires, concentration de polluants, indicateurs sociaux

UU2010

UU_NOM Pop_mun_2

006 BPCO1 UU_BP CO

Ruuto_

BPCO RVIM2_B

PCO MeanNO2 MeanP5NO2 MeanP95NO2 MEANPM10 TMinJanv TMaxJuil Gen_Hab Pneum_Hbt TX_P06_CHOM

1564 TX_SSDIPL0 TX_BAC TX_BACP2 revenu par ménage

PartMenages NonImposabl

es

UsageQuoti dienTabac1 7ans%

VentesCig_

hab

VenteTabac _kg_hab

DecesTabac 65par1000h ab40-64

MEAN_O3_1

00652 Annemasse 118554 140 0,89 21,17 36,19 11,29 68,42 22,30 -2 24 12,8 0,4 0,104 0,172 0,162 0,281 23187 49,9 32 862 118,2 5 23,51

00651 Valence 120922 132 0,56 9,41 43,07 15,50 77,92 23,55 1 26 11,2 0,6 0,135 0,198 0,154 0,226 22970 41,1 32 862 118,2 5 28,97

00751 Bayonne 189836 271 0,64 13,63 26,19 5,35 55,50 20,38 4 23 14,7 0,4 0,117 0,148 0,171 0,237 24127 39,1 33 772 107,6 6 20,43

00754 Avignon 273359 456 0,90 18,54 30,62 8,25 67,46 25,56 2 29 16,2 0,6 0,149 0,255 0,148 0,204 22139 44,9 35 1172 108 5,7 32,90

00752 Béthune 259293 1114 2,76 45,46 24,10 2,67 67,58 26,18 1 22 14,5 0,2 0,159 0,226 0,135 0,132 19401 51,9 33 600 71 7 21,28

00753 Saint-Étienne 286400 809 1,38 27,94 34,50 7,17 72,08 22,00 -1 25 11,0 0,3 0,128 0,229 0,145 0,199 21353 44,9 32 862 118,2 5 27,24

457701 Metz 322946 974 1,81 34,85 32,47 7,92 74,38 17,10 -1 24 13,5 0,3 0,118 0,224 0,141 0,215 22915 41,1 33 559 80 6,7 21,03

00756 Douai-Lens 512462 1814 2,25 41,65 36,63 7,17 94,21 26,15 1 22 10,3 0,3 0,183 0,263 0,132 0,127 20056 51,7 33 600 71 7 24,89

00757 Toulon 543065 1039 0,83 15,40 49,95 10,56 106,85 27,05 6 28 14,5 0,5 0,136 0,185 0,173 0,213 24738 39,6 35 1172 108 5,7 39,68

00758 Lyon 1417463 2180 0,96 20,40 54,95 15,50 106,88 24,48 0 26 11,0 0,2 0,108 0,184 0,155 0,309 26491 34,1 32 862 118,2 5 30,35

00759 Marseille-Aix-en-Provence 1418481 2691 1,03 21,97 44,60 12,08 86,17 28,01 3 29 15,2 0,4 0,156 0,228 0,154 0,249 24568 40,0 35 1172 108 5,7 37,07

00851 Paris 10142977 15006 1,07 20,25 44,20 13,50 88,46 22,82 2 24 10,3 0,1 0,114 0,185 0,161 0,348 31793 27,4 25 964 58,4 5 32,46

06701 Nice 940017 1857 0,85 17,40 37,24 10,15 73,54 30,87 5 26 14,1 0,4 0,114 0,185 0,174 0,247 25005 37,8 35 1172 108 5,7 41,21

10601 Troyes 131039 117,00 0,52 12,97 28,56 8,79 60,52 21,67 -1 24 9,8 0,3 0,15 0,224 0,133 0,183 20211 43,09 35 825 136,4 6,6 25,14

14601 Caen 196323 239 0,81 26,72 31,86 7,17 69,69 19,13 2 21 11,2 0,3 0,136 0,178 0,143 0,252 22067 40,6 40 951 211,8 5,9 26,71

16601 Angoulême 105021 171 0,82 21,09 27,81 7,38 64,46 22,00 2 26 12,1 0,6 0,140 0,183 0,155 0,198 20421 45,9 36 881 191,5 6,7 17,84

17601 La Rochelle 119702 94 0,38 10,37 30,20 8,58 59,33 23,00 3 23 14,5 0,3 0,138 0,165 0,164 0,235 22000 41,3 36 881 191,5 6,7 16,91

21701 Dijon 238088 380 0,96 14,96 38,16 13,54 67,58 19,55 -1 25 9,3 0,2 0,098 0,162 0,161 0,283 24305 33,1 40 930 177,1 6 24,82

25601 Montbéliard 109118 97 0,47 6,09 32,31 6,02 66,48 26,20 -2 23 11,1 0,2 0,155 0,262 0,120 0,167 21900 42,3 36 781 165,8 5,9 29,25

25602 Besançon 134951 121 0,58 13,32 42,28 5,21 87,04 23,00 -1 24 9,7 0,2 0,120 0,169 0,153 0,298 21544 40,8 36 781 165,8 5,9 36,75

29701 Brest 206394 269 0,87 15,58 22,15 4,88 55,42 18,87 4 20 12,9 0,3 0,119 0,112 0,175 0,262 24109 40,3 39 947 197,2 5,8 16,56

30601 Nîmes 161565 289 0,93 16,87 27,96 2,21 70,90 21,65 2 29 16,8 1,2 0,191 0,220 0,157 0,235 20579 46,7 37 833 117,2 5,9 25,97

31701 Toulouse 850873 1034 0,84 15,35 30,37 9,38 66,50 18,33 2 27 14,6 0,4 0,116 0,140 0,168 0,362 25361 35,4 36 697 110,4 5 27,05

33701 Bordeaux 803117 1095 0,87 15,65 29,87 7,58 66,38 19,41 2 25 11,1 0,4 0,115 0,147 0,166 0,294 25580 35,3 33 772 107,6 6 24,27

34701 Montpellier 318225 331 0,68 12,38 38,11 8,67 79,29 21,44 2 28 16,3 0,7 0,166 0,172 0,171 0,362 21920 42,9 37 833 117,2 5,9 36,57

35701 Rennes 282550 238 0,60 10,28 21,29 3,42 51,19 18,00 2 23 13,3 0,4 0,100 0,119 0,169 0,346 24833 34,2 39 947 197,2 5,8 19,71

37701 Tours 306974 457 0,83 16,98 25,64 5,95 58,67 22,08 1 24 12,1 0,2 0,111 0,154 0,158 0,261 24096 37,5 34 886 140,8 5,8 24,65

38701 Grenoble 427658 575 0,82 11,33 41,75 11,56 76,31 24,70 -2 27 12,4 0,5 0,104 0,189 0,150 0,339 25485 35,5 32 862 118,2 5 24,40

44601 Saint-Nazaire 143106 226 0,75 13,62 21,48 5,13 55,23 17,50 3 24 12,6 0,4 0,131 0,148 0,156 0,187 24196 39,3 34 782 181 5,2 23,54

44701 Nantes 568743 413 0,49 11,01 28,52 8,17 57,00 17,68 2 24 12,0 0,2 0,110 0,121 0,168 0,303 27257 33,6 34 782 181 5,2 30,05

45701 Orléans 269283 285 0,67 12,85 23,20 3,66 57,05 23,10 0 24 9,9 0,3 0,095 0,170 0,157 0,269 26422 32,6 34 886 140,8 5,8 24,32

49701 Angers 227771 249 0,66 10,76 30,36 10,92 59,81 18,00 2 24 13,8 0,4 0,127 0,166 0,151 0,270 23349 40,1 34 782 181 5,2 29,11

51701 Reims 212021 296 0,97 22,33 34,11 6,40 74,48 22,57 0 24 12,1 0,5 0,132 0,220 0,145 0,240 22996 38,5 35 825 136,4 6,6 24,99

54701 Nancy 331279 423 0,83 13,17 39,61 12,88 86,71 18,60 -2 23 16,1 0,2 0,114 0,171 0,147 0,281 22878 38,4 33 559 80 6,7 23,02

56601 Lorient 116764 194 0,90 17,13 18,09 2,21 48,48 18,57 3 22 11,7 0,4 0,135 0,145 0,163 0,209 22540 42,0 39 947 197,2 5,8 14,00

57601 Thionville 130437 447 1,76 41,59 35,79 11,58 73,17 17,40 -1 24 11,0 0,1 0,121 0,254 0,135 0,172 23863 47,1 33 559 80 6,7 23,32

59601 Maubeuge 96470 177 1,20 22,94 27,63 6,29 61,83 25,22 0 22 9,1 0,3 0,223 0,259 0,134 0,126 18718 54,3 33 600 71 7 21,96

59602 Dunkerque 182973 325 1,27 17,15 30,65 4,29 74,54 29,71 2 20 12,2 0,5 0,170 0,237 0,139 0,155 23258 43,3 33 600 71 7 27,53

59701 Valenciennes 355660 1015 1,84 47,88 31,20 6,21 72,75 26,26 0 22 10,7 0,3 0,175 0,244 0,132 0,141 20464 49,8 33 600 71 7 26,62

59702 Lille 1242219 2320 1,71 27,48 38,26 7,63 88,94 28,59 0 22 14,5 0,2 0,149 0,213 0,144 0,261 24497 40,1 33 600 71 7 29,94

60601 Creil 101100 150 1,14 26,97 36,86 8,58 78,04 23,67 0 22 13,4 0,3 0,154 0,295 0,135 0,159 22072 45,0 33 943 136,2 6,5 26,54

62504 Calais 103277 199 1,38 36,38 28,00 8,00 65,00 29,00 2 19 13,6 0,3 0,195 0,223 0,144 0,140 19978 47,6 33 600 71 7 20,67

63701 Clermont-Ferrand 260657 167 0,39 7,11 42,54 8,13 96,63 17,75 -1 25 9,3 0,2 0,108 0,146 0,161 0,266 24572 35,7 37 876 172,7 5,7 24,35

64601 Pau 193991 212 0,58 12,33 26,01 5,65 52,25 19,18 1 25 12,7 0,3 0,106 0,138 0,173 0,280 23451 39,4 33 772 107,6 6 18,16

66601 Perpignan 178501 253 0,64 13,22 26,66 2,96 63,67 20,91 4 29 16,9 0,9 0,176 0,217 0,163 0,203 17963 52,9 37 833 117,2 5,9 33,35

67701 Strasbourg 440265 714 1,14 23,30 43,59 15,54 81,50 23,53 2 25 14,0 0,3 0,131 0,206 0,145 0,292 24303 37,2 35 753 62 4,6 32,56

68701 Mulhouse 238638 311 0,78 10,04 38,24 8,50 75,17 24,67 -2 24 10,0 0,3 0,153 0,260 0,136 0,188 24375 41,0 35 753 62 4,6 27,23

72701 Le Mans 192910 168 0,46 9,17 30,24 10,42 60,42 18,92 1 24 10,2 0,3 0,129 0,176 0,140 0,218 23480 39,0 34 782 181 5,2 26,97

73601 Chambéry 119266 123 0,60 5,93 40,43 18,60 66,73 24,70 -3 26 12,6 0,3 0,090 0,147 0,162 0,276 25077 36,6 32 862 118,2 5 28,91

74601 Annecy 144682 153 0,59 18,21 39,31 14,17 72,88 24,30 -2 25 15,4 0,3 0,082 0,158 0,168 0,293 28991 30,4 32 862 118,2 5 27,86

76701 Le Havre 238776 539 1,34 24,48 33,69 7,67 74,65 22,36 2 20 9,8 0,2 0,154 0,221 0,135 0,172 22792 41,8 35 1029 171,4 6,4 30,81

00755 Rouen 388798 427 0,67 15,78 37,86 9,96 76,42 21,50 1 22 12,4 0,3 0,130 0,212 0,139 0,233 24289 37,9 35 1029 171,4 6,4 32,69

80601 Amiens 161311 191 0,84 12,90 37,71 14,50 70,83 24,14 0,5 21 14,1 0,2 0,155 0,227 0,143 0,244 21545 40,7 33 943 136,2 6,5 25,92

86601 Poitiers 126652 171 0,88 15,00 37,16 11,00 76,96 21,33 1 25 13,2 0,3 0,114 0,143 0,163 0,307 21674 42,5 36 881 191,5 6,7 19,81

87601 Limoges 177439 206 0,60 9,53 30,23 8,88 64,50 17,54 0 24 15,2 0,4 0,107 0,160 0,159 0,241 21313 39,2 35 912 159,3 5,9 20,00

(28)

Le tableau des valeurs centrales

Mean SD Min Q1 Q2 Q3 Max CV

Pop_mun_2006 506915,67 1359435,50 96470,00 139028,50 227771,00 343469,50 10142977,00 2,68

BPCO1UU_BPCO 806,25 2039,79 94,00 184,00 289,00 644,50 15006,00 2,53

Tt1UU_Ttes 35993,69 91272,86 4709,00 10692,50 15711,00 23729,00 676974,00 2,54

Ruuto_BPCO 0,95 0,46 0,38 0,64 0,84 1,05 2,76 0,49

RVIM2_BPCO 18,66 9,74 5,93 12,61 15,65 22,15 47,88 0,52

Ruuto_Ttes 0,77 0,13 0,48 0,69 0,77 0,84 1,14 0,17

RVIM2_Ttes 828,13 150,65 470,51 754,92 830,94 879,65 1162,40 0,18

MeanNO2 33,65 7,50 18,09 28,26 32,47 38,20 54,95 0,22

MeanP5NO2 8,64 3,73 2,21 6,11 8,17 10,96 18,60 0,43

MeanP95NO2 71,36 12,89 48,48 62,75 70,83 76,69 106,88 0,18

MEANPM10 22,40 3,52 17,10 19,15 22,30 24,68 30,87 0,16

TMinJanv 0,93 1,94 -3,00 -0,50 1,00 2,00 6,00 2,10

TMaxJuil 24,15 2,38 19,00 22,50 24,00 25,00 29,00 0,10

Gen_Hab 12,64 2,11 9,11 10,98 12,57 14,29 16,90 0,17

Pneum_Hbt 0,35 0,18 0,08 0,25 0,31 0,42 1,21 0,52

TX_P06_CHOM1564 0,13 0,03 0,08 0,11 0,13 0,15 0,22 0,22

TX_SSDIPL0 0,19 0,04 0,11 0,16 0,18 0,22 0,30 0,23

TX_BAC 0,15 0,01 0,12 0,14 0,15 0,16 0,17 0,09

TX_BACP2 0,24 0,06 0,13 0,20 0,24 0,28 0,36 0,26

revenu par ménage 23263,05 2449,73 17962,80 21786,94 23258,10 24532,64 31792,90 0,11

PartMenagesNonImposables 40,81 5,62 27,36 37,62 40,26 43,20 54,29 0,14

UsageQuotidienTabac17ans% 34,44 2,48 25,00 33,00 34,00 36,00 40,00 0,07

VentesCig_hab 832,55 156,96 559,00 772,00 862,00 921,00 1172,00 0,19

VenteTabac_kg_hab 128,65 44,03 58,40 107,60 118,20 171,40 211,80 0,34

DecesTabac65par1000hab40-64 5,93 0,71 4,60 5,20 5,90 6,60 7,00 0,12

MEAN_O3_1 26,40 5,84 14,00 23,17 25,97 29,60 41,21 0,22

(29)

Représentations graphiques de 2 variables

Concentration de dioxyde d'azote dans les UU

MeanNO2

F ré qu en ce

20 30 40 50

0 2 4 6 8 10 1 2 14

0 10 20

0.0e+00 2.5e+06 5.0e+06 7.5e+06 1.0e+07

Population

Nbre de villes

La population des unités urbaines

(30)
(31)

  Mean SD Min Q1 Q2 Q3 Max CV

MeanNO2 33,65 7,50 18,09 28,26 32,47 38,20 54,95 0,22

MeanP5NO2 8,64 3,73 2,21 6,11 8,17 10,96 18,60 0,43

MeanP95NO2 71,36 12,89 48,48 62,75 70,83 76,69 106,88 0,18

MEANPM10 22,40 3,52 17,10 19,15 22,30 24,68 30,87 0,16

Cartographie des concentrations de NO2 à partir du 5 e et 95e

percentile

(32)

Valeurs centrales ne suffisent pas à résumer la distribution d’un caractère

 Donnent une idée des ordres de grandeur de la distribution

 Ne donnent pas d’idée sur la manière dont les modalités se répartissent entre les individus => sur l’hétérogénéité de la distribution : or une des questions essentielles en géo

 => paramètres de dispersion : absolue et relative

(33)

Comment se répartissent les individus dans la distribution ? Les paramètres de dispersion absolue

Dispersion : indique la répartition des valeurs observes autour des valeurs centrales

 Informations sur l’hétérogénéité de la distribution

 Exprimés dans l’unité de mesure de la variable

 Très dépendants des ordres de grandeur de la variable

 Peut avoir des distributions avec valeurs centrales identiques mais

dispersions très différentes

(34)

Paramètres de dispersion absolue : Etendue

 Etendue ou amplitude

 Différences algébrique entre les 2 valeurs extrêmes de la variable

 Ne dpd que de 2 valeurs extrêmes

 Très pertinent si les valeurs extrêmes sont significatives Ex : Amplitude thermiques annuelles

 Etendue sert bcp pour la comparaison de 2 variables

Peu représentative de l’ensemble

(35)

Paramètres de dispersion absolue : Intervalles

 L‘intervalle interquartile

 Différence algébrique entre le 3e et 1er quartile (fréquence cumulée 25 et 75%)

 exprime la dispersion au centre de la distribution

 Est exprimé ds l’unité de mesure de la variable

 L’intervalle interdécile = intervalle de Kelley = 80% effectif

 Différence algébrique entre le 1er et 9e décile

 Exprime la dispersion aux extrêmes sans être influencée par les extrêmes

 L’intervalle intercentile

 Différence algébrique entre le 1er et le 99e centile

 Exprime la dispersion aux extrêmes

(36)

Paramètres de dispersion absolue : La variance et l’écart- type

Ecart-type = écart moyen des valeurs à leur moyenne arithmétique. Exprimé ds l’unité de mesure de la variable. Mesure la dispersion autour de la moyenne des valeurs d’un caractère quantitatif. Toujours >= 0.

Ecart-type = racine carré positive de la variance

 Variance : ro 2 = moyenne arithmétique des carrés des écarts des valeurs à la moyenne arithmétique

 Notion fondamentale en stat

Dumolard, 2003, p. 96

(37)

Paramètres de dispersion absolue : inconvénients

 Très dépendants de l’unité de mesure

 Influencés par les individus extrêmes

Non comparables strictement d’un caractère à l’autre

(38)

Paramètres de dispersion relatives

 Pour comparer la dispersion de caractères aux ordres de grandeurs très différents, aux unités de mesures différentes

Le coefficient de variation ou CV

 Pour comparer des distributions plutôt symétriques

 CV = ecart-type / moyenne

 Sans unité de mesure : varie de 0 à l’infini

 Si proche de 0 = dispersion statistique faible

 Si proche de 0,5 dispersion moyenne

 Si supérieur à 1 dispersion statistique élevée

 parfois exprimé en %

 Le coefficient interquartile : Q3-Q1/Q2

(39)

Le tableau des valeurs centrales … et paramètres de dispersion

Mean SD Min Q1 Q2 Q3 Max CV

Pop_mun_2006 506915,67 1359435,50 96470,00 139028,50 227771,00 343469,50 10142977,00 2,68

BPCO1UU_BPCO 806,25 2039,79 94,00 184,00 289,00 644,50 15006,00 2,53

Tt1UU_Ttes 35993,69 91272,86 4709,00 10692,50 15711,00 23729,00 676974,00 2,54

Ruuto_BPCO 0,95 0,46 0,38 0,64 0,84 1,05 2,76 0,49

RVIM2_BPCO 18,66 9,74 5,93 12,61 15,65 22,15 47,88 0,52

Ruuto_Ttes 0,77 0,13 0,48 0,69 0,77 0,84 1,14 0,17

RVIM2_Ttes 828,13 150,65 470,51 754,92 830,94 879,65 1162,40 0,18

MeanNO2 33,65 7,50 18,09 28,26 32,47 38,20 54,95 0,22

MeanP5NO2 8,64 3,73 2,21 6,11 8,17 10,96 18,60 0,43

MeanP95NO2 71,36 12,89 48,48 62,75 70,83 76,69 106,88 0,18

MEANPM10 22,40 3,52 17,10 19,15 22,30 24,68 30,87 0,16

TMinJanv 0,93 1,94 -3,00 -0,50 1,00 2,00 6,00 2,10

TMaxJuil 24,15 2,38 19,00 22,50 24,00 25,00 29,00 0,10

Gen_Hab 12,64 2,11 9,11 10,98 12,57 14,29 16,90 0,17

Pneum_Hbt 0,35 0,18 0,08 0,25 0,31 0,42 1,21 0,52

TX_P06_CHOM1564 0,13 0,03 0,08 0,11 0,13 0,15 0,22 0,22

TX_SSDIPL0 0,19 0,04 0,11 0,16 0,18 0,22 0,30 0,23

TX_BAC 0,15 0,01 0,12 0,14 0,15 0,16 0,17 0,09

TX_BACP2 0,24 0,06 0,13 0,20 0,24 0,28 0,36 0,26

revenu par ménage 23263,05 2449,73 17962,80 21786,94 23258,10 24532,64 31792,90 0,11

PartMenagesNonImposables 40,81 5,62 27,36 37,62 40,26 43,20 54,29 0,14

UsageQuotidienTabac17ans% 34,44 2,48 25,00 33,00 34,00 36,00 40,00 0,07

VentesCig_hab 832,55 156,96 559,00 772,00 862,00 921,00 1172,00 0,19

VenteTabac_kg_hab 128,65 44,03 58,40 107,60 118,20 171,40 211,80 0,34

DecesTabac65par1000hab40-64 5,93 0,71 4,60 5,20 5,90 6,60 7,00 0,12

MEAN_O3_1 26,40 5,84 14,00 23,17 25,97 29,60 41,21 0,22

(40)

Les boites à moustache pour représenter l’étendue et la concentration des individus dans la distribution

 une vision rapide du comportement de plusieurs caractères dans une population

 Comparer la moyenne des P5 et P95

journaliers en NO2 (ordre de grandeurs ≠)

−2 0 2 4 6

Pneum_Hbt Ruuto_BPCO TMinJanv TX_P06_CHOM1564

V a le ur s

4 Indicateurs pour l'étude de la pollution et de la santé dans les UU

(41)

Représenter graphiquement une distribution statistique

 Pour un caractère discret : diagramme en bâtons

 Pour un caractère continu : histogramme

0 5 10

−2 0 2 4 6

TMinJanv

Nbre de villes UU

Température min de janvier dans les UU

Taux standardisé de Bronchopneumopathies dans les UU

Taux standardisé

Fréquence

0.0 0.5 1.0 1.5 2.0 2.5 3.0

05101520253035

(42)

Discrétiser et représenter une série statistique

 Une classe : un intervalle fermé à gauche et ouvert à droite

Ex : les températures prises entre 5 compris et 15 non compris [5;15[

 Choix du nombre de classes :

 En fonction du nombre d’individus, de l’allure de la variable : ni trop de classes, ni pas assez (si carto max 6 -> 9)

 Choix des bornes et de l’amplitude des classes

 Distribution symétrique : 5 classes autour de la moyenne, amplitude égale : moyenne, écart-type

 Distribution dissymétrique : 4 à 6 classes d’effectifs égaux, autour de la

médiane : médiane, quantile

(43)

Représenter cartographiquement une distribution statistique : une carte en symbole proportionnels

 Un caractère discret = une carte en symboles

(44)

Représenter cartographiquement une distribution statistique : une carte en dégradé de valeurs

 Pour Publication : Titre, Légende, Echelle, Source, Auteur

 Pour une distribution dissymétrique : les quantiles (classes

d’effectifs égaux)

(45)

Représenter cartographiquement une distribution statistique : une carte en dégradé de valeurs

 Pour Publication : Titre, Légende, Echelle, Source, Auteur

 Pour une distribution symétrique :

moyenne et l’écart- type (classes

d’amplitude égale, autour de la

moyenne)

Références

Documents relatifs

Pour lancer la piste audio, veuillez positionner la souris sur l’image de haut- parleur, toujours située en haut à gauche de chaque dia, lorsqu’une piste audio est prévue et,

Aujourd‟hui nous savons que la force nucléaire n‟est pas une force fondamentale, mais, comme dans le cas des atomes pour lesquels les forces interatomiques sont une manifestation

Nous avons remarqué que L’AFC de notre exemple faisait apparaitre une valeur propre égale à 1 que nous n’avons pas pris en compte dans le calcul de l’inertie autour de G,

◮ Isolation : les mises à jour effectuées en cours d’exécution d’une transaction ne sont visibles (pour d’autres transactions ou utilisateurs) qu’à la fin de celle-ci

Médiane Moyenne arithmétique Paramètres de dispersion La boite à moustache ou Box-PlotM.

Les règles de journalisation UNDO consistent à écrire les mises à jour dans le journal avant de modifier la base de données et à n'écrire le COMMIT dans le journal

I La racine de l'arbre est étiquetée par l'axiome de la grammaire (qui est aussi le premier élément de la dérivation gauche). I On parcourt la dérivation de gauche à droite,

I Il peut être utile d'avoir plusieurs états - dans chacque état, Flex peut utiliser des expressions régulières diérentes. I Pour en avoir