Introduction à l’analyse des données en géographie
(Cours 1)
ME1AY030
Master Meci
Statistiques
Manière de structurer l’information
Language universel
Déf rigoureuses, terminologie précise
Ensemble de données numériques concernant catégorie de faits
Ens. de méthodes mathématiques permettant de résumer
l’information aux moyen d’une investigation exhaustive
Statistique Descriptive
Pour étudier/comparer un grand nombre d’individus
Construire une vision globale : un résumé, une information synthétique
Appliquée ici à information quantitative (sf si ACM information qualit ; ou Logit)
Décrire, Classer, Résumer, Hiérarchiser
Rechercher des régularités, des spécificités
≠ stat explicative : tester des hypothèses (régression multiple, logit)
Statistique descriptive en géographie
Permet la comparaison entre des individus statistiques, géographiques (ex ?)
Travaille sur des agrégats de population ou individus
Fournit les moyens de représenter graphiquement (et carto) l’information
Décrire des phénomènes variables dans l’espace (et le temps)
Guide l’interprétation en permettant de distinguer le gnl et le
particulier
Un espace, des individus « géographiques », une question
Quelle question ? Quel espace ? Quels individus géo ?
Quelles sources d’information ? Internationale / Générale /
spécialisée / officielle / ouverte / enquêtes …
Statistique descriptive en Géographie
Délimiter l’espace d’étude
Identifier le type d’individus à étudier : l’échelon d’observation auquel la question est pertinente
Objectif : mise en valeur des différenciations et des similitudes dans l’espace étudié
Information géographique : localisée, localisable =
composante spatiale ≠ composante sémantique
Population et individus en géographie
Population : une collection d’individus statistiques formant un ensemble pertinent, voire un système. Ex ?
Individus : les éléments de la population observée ; peuvent être des objets géographiques (localisables). Ex ?
En géographie on parle parfois d’unité spatiale au sujet des individus
statistiques : les unités spatiales peuvent être de dimensions différentes
(grandes ou petites), d’implantations diverses (linéaires ou ponctuelles, ou
surfaciques)
Population et individus en géographie
Dumolard, 2003, p. 24
Population et individus en géographie
P o p u la ti o n in d iv id u s
Caractères
L’information sémantique associée aux individus
Les caractères de la population : (les variables du tableau d’information géographique)
Caractères : sont des propriétés communes à tous les individus de la population étudiée
Caractères : ont des modalités : un ensemble de modalité
Un individu = une modalité et une seule pour un caractère
Tout individu a une modalité pour un caractère (sf valeurs
manquantes)
Caractères : qualitatifs ou quantitatifs
Quantitatifs : modalités du caractère sont exprimées par des quantités issues d’une mesure ; elles se traduisent par des
nombres ; 2 modalités peuvent être comparées par un opérateur logique
Quantitatif discret : il ne peut prendre que certaines valeurs isolées dans son intervalle de variation : par ex des nbres entiers
Continu : le caractère peut prendre potentiellement toutes les valeurs à l’intérieur de son intervalle de variation. Ses valeurs peuvent être des nombres réels (IR ; décimaux)
Qualitatifs : traduisent des états distincts ; ne peuvent être
comparés : sf si ordinaux ; mais peuvent aussi être analysés pour
la manière dont ils caractérisent une population. ex ?
Quantitatifs continus
Quantitatifs discrets
Qualitatif nominal
Qualitatif ordinal
Caractères : qualitatifs ou quantitatifs
Dumolard, 2003, p. 13
Tableau d’information géographique
Ex : La pollution par le NO2 dans les villes françaises en février 2001
LIBUU _01FEB _02FEB _03FEB _04FEB _05FEB _06FEB _07FEB _08FEB _09FEB _10FEB _11FEB
AMIENS 69,04 45,54 24,99 12,08 19,95 19,11 27,98 21,94 47,39 40,55 14,18
ANGERS 47,95 33,56 17,72 8,52 14,25 14,66 24,01 22,10 29,30 23,15 12,38
ANGOULEME 34,81 30,93 21,54 10,01 21,82 21,33 16,85 20,10 28,16 22,27 15,41
ANNECY 32,49 51,03 35,50 29,09 30,42 50,72 56,14 30,70 25,99 31,88 35,55
AVIGNON 27,46 44,13 74,84 38,97 56,65 28,15 13,14 28,26 31,95 19,84 50,43
BAYONNE 35,77 34,96 30,03 16,91 23,20 10,11 14,88 17,42 31,49 36,79 25,68
BESANCON 63,91 43,05 21,86 16,77 19,79 24,41 37,18 24,81 33,15 37,66 43,55
BETHUNE 73,15 64,16 30,85 13,24 20,92 19,12 32,89 21,23 41,85 45,03 14,95
BORDEAUX 38,01 43,41 21,03 21,75 35,43 34,90 33,85 32,35 36,50 31,61 21,83
BREST 31,25 39,07 18,46 11,97 19,15 19,38 30,15 35,88 38,53 19,79 11,98
CAEN 48,48 37,90 32,57 12,65 27,38 28,99 31,51 28,52 42,66 32,36 18,80
CHAMBERY 36,06 52,87 45,10 25,39 42,86 54,55 46,60 24,68 28,23 36,64 45,06
CLERMONT-FERRAND 37,78 51,26 27,61 15,45 20,86 24,88 16,36 24,07 18,43 37,74 41,42
DIJON 39,50 41,03 36,88 15,80 19,93 38,02 24,10 33,83 27,83 34,60 34,73
DOUAI-LENS 62,65 58,89 25,50 11,98 16,37 19,34 25,17 15,32 39,44 35,47 14,41
DUNKERQUE 76,97 59,79 48,03 20,70 24,29 25,26 37,68 30,14 44,03 48,38 12,36
GENEVE(CH)-ANNEMASSE (*) 27,67 52,89 31,84 23,16 26,71 43,18 44,59 29,40 31,89 38,33 42,66
GRENOBLE 45,84 57,26 70,32 47,67 57,78 36,12 11,23 24,28 37,81 38,77 45,34
LA ROCHELLE 40,05 36,80 20,82 9,35 19,34 20,91 23,46 25,32 30,42 25,30 18,28
LE HAVRE 70,94 39,25 26,92 13,50 22,58 21,88 34,73 25,66 43,00 39,84 19,46
LE MANS 53,84 50,90 30,71 15,47 31,21 27,53 34,40 39,12 49,58 39,05 24,58
LILLE (*) 72,63 62,24 37,92 21,23 26,69 29,56 33,78 24,71 49,59 43,91 19,77
LIMOGES 25,21 32,12 20,84 10,44 18,07 20,54 16,08 17,61 21,65 22,70 20,68
LORIENT 28,90 12,60 3,52 2,98 4,21 4,91 10,62 15,91 20,87 8,75 5,73
LYON 45,17 65,63 57,23 36,19 44,53 31,51 22,77 40,13 41,11 41,67 60,33
MARSEILLE-AIX-EN-PROVENCE 38,72 47,95 43,45 28,81 49,87 23,88 14,55 25,46 25,89 34,35 51,31
MAUBEUGE (*) 51,42 33,26 16,76 7,91 12,93 13,44 11,58 10,45 29,18 19,28 6,61
METZ 49,69 33,90 11,87 7,57 6,54 18,42 29,64 17,59 26,42 32,34 23,81
MONTBELIARD 49,38 38,54 19,18 18,22 15,20 32,97 61,98 35,67 27,38 39,03 37,80
Population ? Individus ? Caractères ?
L’information est organisée dans un tableau d’information géographique
Ex : La structure par âge des 22 (anciennes) régions françaises
CODE NOM POP0-14 POP15-19 POP20-39 POP40-59 POP60-74 POP75
11 ILE-DE-FRANCE 2061864 702129 3449572 2917322 1184257 635992
21 CHAMPAGNE-ARDENNE 244649 95517 376159 345501 180592 99784
22 PICARDIE 363283 136940 520921 481358 232499 122104
23 HAUTE-NORMANDIE 342479 131493 497555 461606 225002 122304
24 CENTRE 424802 162168 648196 635295 354570 214931
25 BASSE-NORMANDIE 257175 101280 380357 358847 209368 115409
26 BOURGOGNE 269450 105957 416690 420355 247663 150292
31 NORD-PAS-DE-CALAIS 805229 314019 1151043 976688 498126 250766
41 LORRAINE 416197 162588 652559 596537 325141 157001
42 ALSACE 316800 114780 517944 453425 223517 107266
43 FRANCHE-COMTE 202033 79369 309138 289786 153559 83372
52 PAYS DE LA LOIRE 585729 232937 890430 812542 446795 254351
53 BRETAGNE 501925 198368 783710 731423 444135 247617
54 POITOU-CHARENTES 262437 106133 421831 425894 262525 161633
72 AQUITAINE 463331 182687 771618 767228 448944 275145
73 MIDI-PYRENEES 402428 153963 692894 664828 394405 244178
74 LIMOUSIN 97837 40636 176856 186422 125363 83678
82 RHONE-ALPES 1045155 385633 1610746 1472678 730896 400739
83 AUVERGNE 199480 82219 341759 350524 210150 124524
91 LANGUEDOC-ROUSSILLON 379415 145851 603540 590557 358990 218004
93 PROVENCE-ALPES-COTE D'AZUR 765888 281571 1186481 1184529 675452 412332
94 CORSE 41753 15863 67741 70036 41267 23489
La source du tableau d’info géo : un tableau élémentaire
Ex : une enquête individuelle
CODE ag e se xe se rie ac t s al a co m de p T ra ns _T T ra ns _D T ra ns _M br u_ D ly o_ D ni c_ D or l_ D pr a_ D ba r_ D br u_ R ly o_ R ni c_ R or l_ R pr a_ R ba r_ R ab i_ C br a_ C bu c_ C ku a_ C
1 18 H es 2 75011 75 20 1,5 tc 400 400 700 180 1000 1000 n o n o o n AFR EUR EUR ASIE
2 18 H s 2 75009 75 30 7 tc 300 400 800 100 1000 1000 n o n n n AFR EUR EUR ASIE
3 18 F es 0 75020 75 40 2 tc 350 600 780 100 900 1000 n n n o n n EUR EUR EUR
4 18 H s 0 75011 75 30 tc 500 500 980 700 1600 1500 n o n n n o AFR EUR
5 18 H es 0 75018 75 40 tc 80 90 95 11 120 100 o n n n n n AFR EUR EUR ASIE
6 18 H es 0 91220 91 45 35 tc 200 450 800 n o n o n n AFR EUR
7 19 F es 3 91250 91 75 50 tc 1500 500 1100 150 2000 o o o o n n EUR
8 19 F l 0 75020 75 30 tc 800 500 950 150 1700 1100 AFR EUR EUR ASIE
9 19 H es 2 77176 77 75 50 tc 300 400 800 120 500 1200 AFR EUR AMER
10 19 F s 2 92350 92 45 30 tc 200 500 1000 100 700 1100 n o o o o o AFR EUR EUR ASIE
11 19 H l 0 78230 78 45 35 tc 600 600 980 400 1600 1500 n n o n n n AFR EUR
12 19 F s 0 94370 94 70 15 tc 300 700 900 150 1100 1200 n n n n n n AFR EUR
13 19 H es 0 93330 93 60 25 tc 400 500 700 150 600 1000 n n n o n n AFR EUR EUR AMER
14 19 F es 0 91260 91 45 20 tc 400 500 800 150 2500 1500 o o o n n n AFR EUR
15 20 F l 0 75010 75 35 10 tc 300 600 800 120 1500 1000 n o n o n o EUR EUR EUR AMER
16 20 H stt 2 93360 93 60 80 tc 400 300 800 130 1200 1100 o o n o n n AFR EUR EUR ASIE
17 20 H s 0 75001 75 15 2 v 500 450 800 100 1000 1000 o o n n n n AFR EUR
18 21 H l 3 92100 92 45 20 tc 350 600 750 750 1800 850 n n n n n n AFR EUR EUR ASIE
19 21 H s 3 75012 75 30 2 tc 400 700 1000 300 1500 2000 o o n o n n AFR EUR EUR OCEA
20 21 F es 2 94400 94 45 3 tc 300 400 750 150 2000 1500 n o n n n n AFR EUR EUR ASIE
21 21 F l 2 91160 91 60 25 tc 300 900 700 150 1700 1200 o o n n n o AFR EUR EUR AFR
22 21 H stl 2 75018 75 45 7,5 tv v 500 600 1000 100 2000 1400 n o o n n n AFR EUR
23 21 H s 0 95190 95 60 tc 250 400 1000 120 2500 1200 o o n o n n AFR EUR EUR AFR
24 22 H s 2 75012 75 20 5 tc 550 400 750 150 1400 950 n n n n n o AFR EUR EUR ASIE
25 22 H s 1 93500 93 70 7 tc 340 400 800 250 750 900 n o n n n n AFR EUR EUR ASIE
26 17 F s 0 75016 75 30 8 tc 300 400 700 200 1300 1200 o o n o n n AFR EUR EUR ASIE
27 18 F es 0 75019 75 45 15 300 500 850 100 1600 1200 n n n n n n AFR EUR ASIE
28 18 H l 0 92240 92 40 10 tc 450 500 800 300 1400 1300 n n n n n o ASIE EUR
29 18 F shs 2 75013 75 15 2 pied 300 450 700 1000 n n n n n n AFR ASIE EUR
30 18 H es 0 94500 94 50 16 tc 300 400 700 200 1500 900 n n n o n n EUR EUR ASIE
31 18 F es 0 91390 91 60 20 tc 320 500 800 130 1000 1400 n o o o n n AFR EUR ASIE
32 19 H s 0 77176 77 90 50 tc 250 450 600 90 1200 950 n n n o n n AFR EUR EUR ASIE
33 19 H es 2 77176 77 75 50 tc 500 450 920 200 700 1200 n o o o n n AFR EUR EUR
34 19 F l 0 75012 75 20 5 tc 350 500 750 200 900 1000 n o n n n n AFR
Résumer la distribution statistique d’un caractère : valeurs centrales et paramètres de dispersion
(cours 2)
Résumer et décrire la distribution statistique d’un caractère quantitatif
Résumer l’ensemble des informations contenues dans le tableau d’information géographique à l’aide de quelques chiffres significatifs
Les valeurs centrales
Les paramètres de dispersion
Les valeurs centrales pour résumer le niveau d’une variable
Le mode
La moyenne
La médiane
La moyenne arithmétique : C’est la somme des modalités adoptées par chaque individu de l’ensemble observé, rapporté au nombre d’individus. La moyenne arithmétique est fonction de toutes les observations mais est sensible aux valeurs extrêmes : c’est un indicateur peu robuste.
å =
= n
i
x i
x n
1
1
La moyenne : niveau élevé ou faible ?
C’est la valeur la plus fréquente pour la distribution d’un caractère quantitatif discret
c’est la classe correspondant au pic de l’histogramme pour une variable quantitative continue. Dans ce dernier cas, sa détermination est donc malaisée et dépend du découpage en classe .
Le mode : une valeur fréquente
La médiane, notée Q2 est la modalité de la variable telle que la moitié des valeurs lui est inférieure et l’autre moitié supérieure (Dumolard et al, 2003, Les statistiques en géographie, p. 91).
C’est la modalité d’un caractère qui partage la distribution statistiques en deux classes d’égales fréquences
La médiane : au centre de la distribution statistique
Propriétés des valeurs centrales
Etre définie de façon objective : 2 personnes traitant la même information doivent trouver le même résultat
Dépendre de tous les individus
Avoir une signification concrète
Etre simple à calculer
Etre peu sensible aux fluctuations de l’ensemble observé
Se prêter au calcul algébrique
Formes des distributions statistiques des caractères
Comment se répartissent les individus observés dans l’ensemble des modalités possibles du caractère
Distribution Symétrique
Dissymétrique
Bimodale
Distribution symétrique
Moyenne = Médiane = Mode
Une variante des distributions symétriques : les distributions gaussienne = loi normale.
Presque toutes les valeurs sont comprises entre la moyenne et + ou – 3 écart-type
Dumolard, 2003, p. 113
Grasland
Formes des distributions : dissymétrique
A droite
médiane > moyenne
une grande partie des individus adoptent des modalités élevées
A gauche
médiane < moyenne
une grande partie des individus adoptent des modalités faibles
Grasland
Formes des distributions : bimodale
Mode 1 > Moyenne = Médiane > Mode 2
Le tableau d’information : pathologies respiratoires, concentration de polluants, indicateurs sociaux
UU2010
UU_NOM Pop_mun_2
006 BPCO1 UU_BP CO
Ruuto_
BPCO RVIM2_B
PCO MeanNO2 MeanP5NO2 MeanP95NO2 MEANPM10 TMinJanv TMaxJuil Gen_Hab Pneum_Hbt TX_P06_CHOM
1564 TX_SSDIPL0 TX_BAC TX_BACP2 revenu par ménage
PartMenages NonImposabl
es
UsageQuoti dienTabac1 7ans%
VentesCig_
hab
VenteTabac _kg_hab
DecesTabac 65par1000h ab40-64
MEAN_O3_1
00652 Annemasse 118554 140 0,89 21,17 36,19 11,29 68,42 22,30 -2 24 12,8 0,4 0,104 0,172 0,162 0,281 23187 49,9 32 862 118,2 5 23,51
00651 Valence 120922 132 0,56 9,41 43,07 15,50 77,92 23,55 1 26 11,2 0,6 0,135 0,198 0,154 0,226 22970 41,1 32 862 118,2 5 28,97
00751 Bayonne 189836 271 0,64 13,63 26,19 5,35 55,50 20,38 4 23 14,7 0,4 0,117 0,148 0,171 0,237 24127 39,1 33 772 107,6 6 20,43
00754 Avignon 273359 456 0,90 18,54 30,62 8,25 67,46 25,56 2 29 16,2 0,6 0,149 0,255 0,148 0,204 22139 44,9 35 1172 108 5,7 32,90
00752 Béthune 259293 1114 2,76 45,46 24,10 2,67 67,58 26,18 1 22 14,5 0,2 0,159 0,226 0,135 0,132 19401 51,9 33 600 71 7 21,28
00753 Saint-Étienne 286400 809 1,38 27,94 34,50 7,17 72,08 22,00 -1 25 11,0 0,3 0,128 0,229 0,145 0,199 21353 44,9 32 862 118,2 5 27,24
457701 Metz 322946 974 1,81 34,85 32,47 7,92 74,38 17,10 -1 24 13,5 0,3 0,118 0,224 0,141 0,215 22915 41,1 33 559 80 6,7 21,03
00756 Douai-Lens 512462 1814 2,25 41,65 36,63 7,17 94,21 26,15 1 22 10,3 0,3 0,183 0,263 0,132 0,127 20056 51,7 33 600 71 7 24,89
00757 Toulon 543065 1039 0,83 15,40 49,95 10,56 106,85 27,05 6 28 14,5 0,5 0,136 0,185 0,173 0,213 24738 39,6 35 1172 108 5,7 39,68
00758 Lyon 1417463 2180 0,96 20,40 54,95 15,50 106,88 24,48 0 26 11,0 0,2 0,108 0,184 0,155 0,309 26491 34,1 32 862 118,2 5 30,35
00759 Marseille-Aix-en-Provence 1418481 2691 1,03 21,97 44,60 12,08 86,17 28,01 3 29 15,2 0,4 0,156 0,228 0,154 0,249 24568 40,0 35 1172 108 5,7 37,07
00851 Paris 10142977 15006 1,07 20,25 44,20 13,50 88,46 22,82 2 24 10,3 0,1 0,114 0,185 0,161 0,348 31793 27,4 25 964 58,4 5 32,46
06701 Nice 940017 1857 0,85 17,40 37,24 10,15 73,54 30,87 5 26 14,1 0,4 0,114 0,185 0,174 0,247 25005 37,8 35 1172 108 5,7 41,21
10601 Troyes 131039 117,00 0,52 12,97 28,56 8,79 60,52 21,67 -1 24 9,8 0,3 0,15 0,224 0,133 0,183 20211 43,09 35 825 136,4 6,6 25,14
14601 Caen 196323 239 0,81 26,72 31,86 7,17 69,69 19,13 2 21 11,2 0,3 0,136 0,178 0,143 0,252 22067 40,6 40 951 211,8 5,9 26,71
16601 Angoulême 105021 171 0,82 21,09 27,81 7,38 64,46 22,00 2 26 12,1 0,6 0,140 0,183 0,155 0,198 20421 45,9 36 881 191,5 6,7 17,84
17601 La Rochelle 119702 94 0,38 10,37 30,20 8,58 59,33 23,00 3 23 14,5 0,3 0,138 0,165 0,164 0,235 22000 41,3 36 881 191,5 6,7 16,91
21701 Dijon 238088 380 0,96 14,96 38,16 13,54 67,58 19,55 -1 25 9,3 0,2 0,098 0,162 0,161 0,283 24305 33,1 40 930 177,1 6 24,82
25601 Montbéliard 109118 97 0,47 6,09 32,31 6,02 66,48 26,20 -2 23 11,1 0,2 0,155 0,262 0,120 0,167 21900 42,3 36 781 165,8 5,9 29,25
25602 Besançon 134951 121 0,58 13,32 42,28 5,21 87,04 23,00 -1 24 9,7 0,2 0,120 0,169 0,153 0,298 21544 40,8 36 781 165,8 5,9 36,75
29701 Brest 206394 269 0,87 15,58 22,15 4,88 55,42 18,87 4 20 12,9 0,3 0,119 0,112 0,175 0,262 24109 40,3 39 947 197,2 5,8 16,56
30601 Nîmes 161565 289 0,93 16,87 27,96 2,21 70,90 21,65 2 29 16,8 1,2 0,191 0,220 0,157 0,235 20579 46,7 37 833 117,2 5,9 25,97
31701 Toulouse 850873 1034 0,84 15,35 30,37 9,38 66,50 18,33 2 27 14,6 0,4 0,116 0,140 0,168 0,362 25361 35,4 36 697 110,4 5 27,05
33701 Bordeaux 803117 1095 0,87 15,65 29,87 7,58 66,38 19,41 2 25 11,1 0,4 0,115 0,147 0,166 0,294 25580 35,3 33 772 107,6 6 24,27
34701 Montpellier 318225 331 0,68 12,38 38,11 8,67 79,29 21,44 2 28 16,3 0,7 0,166 0,172 0,171 0,362 21920 42,9 37 833 117,2 5,9 36,57
35701 Rennes 282550 238 0,60 10,28 21,29 3,42 51,19 18,00 2 23 13,3 0,4 0,100 0,119 0,169 0,346 24833 34,2 39 947 197,2 5,8 19,71
37701 Tours 306974 457 0,83 16,98 25,64 5,95 58,67 22,08 1 24 12,1 0,2 0,111 0,154 0,158 0,261 24096 37,5 34 886 140,8 5,8 24,65
38701 Grenoble 427658 575 0,82 11,33 41,75 11,56 76,31 24,70 -2 27 12,4 0,5 0,104 0,189 0,150 0,339 25485 35,5 32 862 118,2 5 24,40
44601 Saint-Nazaire 143106 226 0,75 13,62 21,48 5,13 55,23 17,50 3 24 12,6 0,4 0,131 0,148 0,156 0,187 24196 39,3 34 782 181 5,2 23,54
44701 Nantes 568743 413 0,49 11,01 28,52 8,17 57,00 17,68 2 24 12,0 0,2 0,110 0,121 0,168 0,303 27257 33,6 34 782 181 5,2 30,05
45701 Orléans 269283 285 0,67 12,85 23,20 3,66 57,05 23,10 0 24 9,9 0,3 0,095 0,170 0,157 0,269 26422 32,6 34 886 140,8 5,8 24,32
49701 Angers 227771 249 0,66 10,76 30,36 10,92 59,81 18,00 2 24 13,8 0,4 0,127 0,166 0,151 0,270 23349 40,1 34 782 181 5,2 29,11
51701 Reims 212021 296 0,97 22,33 34,11 6,40 74,48 22,57 0 24 12,1 0,5 0,132 0,220 0,145 0,240 22996 38,5 35 825 136,4 6,6 24,99
54701 Nancy 331279 423 0,83 13,17 39,61 12,88 86,71 18,60 -2 23 16,1 0,2 0,114 0,171 0,147 0,281 22878 38,4 33 559 80 6,7 23,02
56601 Lorient 116764 194 0,90 17,13 18,09 2,21 48,48 18,57 3 22 11,7 0,4 0,135 0,145 0,163 0,209 22540 42,0 39 947 197,2 5,8 14,00
57601 Thionville 130437 447 1,76 41,59 35,79 11,58 73,17 17,40 -1 24 11,0 0,1 0,121 0,254 0,135 0,172 23863 47,1 33 559 80 6,7 23,32
59601 Maubeuge 96470 177 1,20 22,94 27,63 6,29 61,83 25,22 0 22 9,1 0,3 0,223 0,259 0,134 0,126 18718 54,3 33 600 71 7 21,96
59602 Dunkerque 182973 325 1,27 17,15 30,65 4,29 74,54 29,71 2 20 12,2 0,5 0,170 0,237 0,139 0,155 23258 43,3 33 600 71 7 27,53
59701 Valenciennes 355660 1015 1,84 47,88 31,20 6,21 72,75 26,26 0 22 10,7 0,3 0,175 0,244 0,132 0,141 20464 49,8 33 600 71 7 26,62
59702 Lille 1242219 2320 1,71 27,48 38,26 7,63 88,94 28,59 0 22 14,5 0,2 0,149 0,213 0,144 0,261 24497 40,1 33 600 71 7 29,94
60601 Creil 101100 150 1,14 26,97 36,86 8,58 78,04 23,67 0 22 13,4 0,3 0,154 0,295 0,135 0,159 22072 45,0 33 943 136,2 6,5 26,54
62504 Calais 103277 199 1,38 36,38 28,00 8,00 65,00 29,00 2 19 13,6 0,3 0,195 0,223 0,144 0,140 19978 47,6 33 600 71 7 20,67
63701 Clermont-Ferrand 260657 167 0,39 7,11 42,54 8,13 96,63 17,75 -1 25 9,3 0,2 0,108 0,146 0,161 0,266 24572 35,7 37 876 172,7 5,7 24,35
64601 Pau 193991 212 0,58 12,33 26,01 5,65 52,25 19,18 1 25 12,7 0,3 0,106 0,138 0,173 0,280 23451 39,4 33 772 107,6 6 18,16
66601 Perpignan 178501 253 0,64 13,22 26,66 2,96 63,67 20,91 4 29 16,9 0,9 0,176 0,217 0,163 0,203 17963 52,9 37 833 117,2 5,9 33,35
67701 Strasbourg 440265 714 1,14 23,30 43,59 15,54 81,50 23,53 2 25 14,0 0,3 0,131 0,206 0,145 0,292 24303 37,2 35 753 62 4,6 32,56
68701 Mulhouse 238638 311 0,78 10,04 38,24 8,50 75,17 24,67 -2 24 10,0 0,3 0,153 0,260 0,136 0,188 24375 41,0 35 753 62 4,6 27,23
72701 Le Mans 192910 168 0,46 9,17 30,24 10,42 60,42 18,92 1 24 10,2 0,3 0,129 0,176 0,140 0,218 23480 39,0 34 782 181 5,2 26,97
73601 Chambéry 119266 123 0,60 5,93 40,43 18,60 66,73 24,70 -3 26 12,6 0,3 0,090 0,147 0,162 0,276 25077 36,6 32 862 118,2 5 28,91
74601 Annecy 144682 153 0,59 18,21 39,31 14,17 72,88 24,30 -2 25 15,4 0,3 0,082 0,158 0,168 0,293 28991 30,4 32 862 118,2 5 27,86
76701 Le Havre 238776 539 1,34 24,48 33,69 7,67 74,65 22,36 2 20 9,8 0,2 0,154 0,221 0,135 0,172 22792 41,8 35 1029 171,4 6,4 30,81
00755 Rouen 388798 427 0,67 15,78 37,86 9,96 76,42 21,50 1 22 12,4 0,3 0,130 0,212 0,139 0,233 24289 37,9 35 1029 171,4 6,4 32,69
80601 Amiens 161311 191 0,84 12,90 37,71 14,50 70,83 24,14 0,5 21 14,1 0,2 0,155 0,227 0,143 0,244 21545 40,7 33 943 136,2 6,5 25,92
86601 Poitiers 126652 171 0,88 15,00 37,16 11,00 76,96 21,33 1 25 13,2 0,3 0,114 0,143 0,163 0,307 21674 42,5 36 881 191,5 6,7 19,81
87601 Limoges 177439 206 0,60 9,53 30,23 8,88 64,50 17,54 0 24 15,2 0,4 0,107 0,160 0,159 0,241 21313 39,2 35 912 159,3 5,9 20,00
Le tableau des valeurs centrales
Mean SD Min Q1 Q2 Q3 Max CV
Pop_mun_2006 506915,67 1359435,50 96470,00 139028,50 227771,00 343469,50 10142977,00 2,68
BPCO1UU_BPCO 806,25 2039,79 94,00 184,00 289,00 644,50 15006,00 2,53
Tt1UU_Ttes 35993,69 91272,86 4709,00 10692,50 15711,00 23729,00 676974,00 2,54
Ruuto_BPCO 0,95 0,46 0,38 0,64 0,84 1,05 2,76 0,49
RVIM2_BPCO 18,66 9,74 5,93 12,61 15,65 22,15 47,88 0,52
Ruuto_Ttes 0,77 0,13 0,48 0,69 0,77 0,84 1,14 0,17
RVIM2_Ttes 828,13 150,65 470,51 754,92 830,94 879,65 1162,40 0,18
MeanNO2 33,65 7,50 18,09 28,26 32,47 38,20 54,95 0,22
MeanP5NO2 8,64 3,73 2,21 6,11 8,17 10,96 18,60 0,43
MeanP95NO2 71,36 12,89 48,48 62,75 70,83 76,69 106,88 0,18
MEANPM10 22,40 3,52 17,10 19,15 22,30 24,68 30,87 0,16
TMinJanv 0,93 1,94 -3,00 -0,50 1,00 2,00 6,00 2,10
TMaxJuil 24,15 2,38 19,00 22,50 24,00 25,00 29,00 0,10
Gen_Hab 12,64 2,11 9,11 10,98 12,57 14,29 16,90 0,17
Pneum_Hbt 0,35 0,18 0,08 0,25 0,31 0,42 1,21 0,52
TX_P06_CHOM1564 0,13 0,03 0,08 0,11 0,13 0,15 0,22 0,22
TX_SSDIPL0 0,19 0,04 0,11 0,16 0,18 0,22 0,30 0,23
TX_BAC 0,15 0,01 0,12 0,14 0,15 0,16 0,17 0,09
TX_BACP2 0,24 0,06 0,13 0,20 0,24 0,28 0,36 0,26
revenu par ménage 23263,05 2449,73 17962,80 21786,94 23258,10 24532,64 31792,90 0,11
PartMenagesNonImposables 40,81 5,62 27,36 37,62 40,26 43,20 54,29 0,14
UsageQuotidienTabac17ans% 34,44 2,48 25,00 33,00 34,00 36,00 40,00 0,07
VentesCig_hab 832,55 156,96 559,00 772,00 862,00 921,00 1172,00 0,19
VenteTabac_kg_hab 128,65 44,03 58,40 107,60 118,20 171,40 211,80 0,34
DecesTabac65par1000hab40-64 5,93 0,71 4,60 5,20 5,90 6,60 7,00 0,12
MEAN_O3_1 26,40 5,84 14,00 23,17 25,97 29,60 41,21 0,22
Représentations graphiques de 2 variables
Concentration de dioxyde d'azote dans les UU
MeanNO2
F ré qu en ce
20 30 40 50
0 2 4 6 8 10 1 2 14
0 10 20
0.0e+00 2.5e+06 5.0e+06 7.5e+06 1.0e+07
Population
Nbre de villes
La population des unités urbaines
Mean SD Min Q1 Q2 Q3 Max CV
MeanNO2 33,65 7,50 18,09 28,26 32,47 38,20 54,95 0,22
MeanP5NO2 8,64 3,73 2,21 6,11 8,17 10,96 18,60 0,43
MeanP95NO2 71,36 12,89 48,48 62,75 70,83 76,69 106,88 0,18
MEANPM10 22,40 3,52 17,10 19,15 22,30 24,68 30,87 0,16
Cartographie des concentrations de NO2 à partir du 5 e et 95e
percentile
Valeurs centrales ne suffisent pas à résumer la distribution d’un caractère
Donnent une idée des ordres de grandeur de la distribution
Ne donnent pas d’idée sur la manière dont les modalités se répartissent entre les individus => sur l’hétérogénéité de la distribution : or une des questions essentielles en géo
=> paramètres de dispersion : absolue et relative
Comment se répartissent les individus dans la distribution ? Les paramètres de dispersion absolue
Dispersion : indique la répartition des valeurs observes autour des valeurs centrales
Informations sur l’hétérogénéité de la distribution
Exprimés dans l’unité de mesure de la variable
Très dépendants des ordres de grandeur de la variable
Peut avoir des distributions avec valeurs centrales identiques mais
dispersions très différentes
Paramètres de dispersion absolue : Etendue
Etendue ou amplitude
Différences algébrique entre les 2 valeurs extrêmes de la variable
Ne dpd que de 2 valeurs extrêmes
Très pertinent si les valeurs extrêmes sont significatives Ex : Amplitude thermiques annuelles
Etendue sert bcp pour la comparaison de 2 variables
Peu représentative de l’ensemble
Paramètres de dispersion absolue : Intervalles
L‘intervalle interquartile
Différence algébrique entre le 3e et 1er quartile (fréquence cumulée 25 et 75%)
exprime la dispersion au centre de la distribution
Est exprimé ds l’unité de mesure de la variable
L’intervalle interdécile = intervalle de Kelley = 80% effectif
Différence algébrique entre le 1er et 9e décile
Exprime la dispersion aux extrêmes sans être influencée par les extrêmes
L’intervalle intercentile
Différence algébrique entre le 1er et le 99e centile
Exprime la dispersion aux extrêmes
Paramètres de dispersion absolue : La variance et l’écart- type
Ecart-type = écart moyen des valeurs à leur moyenne arithmétique. Exprimé ds l’unité de mesure de la variable. Mesure la dispersion autour de la moyenne des valeurs d’un caractère quantitatif. Toujours >= 0.
Ecart-type = racine carré positive de la variance
Variance : ro 2 = moyenne arithmétique des carrés des écarts des valeurs à la moyenne arithmétique
Notion fondamentale en stat
Dumolard, 2003, p. 96
Paramètres de dispersion absolue : inconvénients
Très dépendants de l’unité de mesure
Influencés par les individus extrêmes
Non comparables strictement d’un caractère à l’autre
Paramètres de dispersion relatives
Pour comparer la dispersion de caractères aux ordres de grandeurs très différents, aux unités de mesures différentes
Le coefficient de variation ou CV
Pour comparer des distributions plutôt symétriques
CV = ecart-type / moyenne
Sans unité de mesure : varie de 0 à l’infini
Si proche de 0 = dispersion statistique faible
Si proche de 0,5 dispersion moyenne
Si supérieur à 1 dispersion statistique élevée
parfois exprimé en %
Le coefficient interquartile : Q3-Q1/Q2
Le tableau des valeurs centrales … et paramètres de dispersion
Mean SD Min Q1 Q2 Q3 Max CV
Pop_mun_2006 506915,67 1359435,50 96470,00 139028,50 227771,00 343469,50 10142977,00 2,68
BPCO1UU_BPCO 806,25 2039,79 94,00 184,00 289,00 644,50 15006,00 2,53
Tt1UU_Ttes 35993,69 91272,86 4709,00 10692,50 15711,00 23729,00 676974,00 2,54
Ruuto_BPCO 0,95 0,46 0,38 0,64 0,84 1,05 2,76 0,49
RVIM2_BPCO 18,66 9,74 5,93 12,61 15,65 22,15 47,88 0,52
Ruuto_Ttes 0,77 0,13 0,48 0,69 0,77 0,84 1,14 0,17
RVIM2_Ttes 828,13 150,65 470,51 754,92 830,94 879,65 1162,40 0,18
MeanNO2 33,65 7,50 18,09 28,26 32,47 38,20 54,95 0,22
MeanP5NO2 8,64 3,73 2,21 6,11 8,17 10,96 18,60 0,43
MeanP95NO2 71,36 12,89 48,48 62,75 70,83 76,69 106,88 0,18
MEANPM10 22,40 3,52 17,10 19,15 22,30 24,68 30,87 0,16
TMinJanv 0,93 1,94 -3,00 -0,50 1,00 2,00 6,00 2,10
TMaxJuil 24,15 2,38 19,00 22,50 24,00 25,00 29,00 0,10
Gen_Hab 12,64 2,11 9,11 10,98 12,57 14,29 16,90 0,17
Pneum_Hbt 0,35 0,18 0,08 0,25 0,31 0,42 1,21 0,52
TX_P06_CHOM1564 0,13 0,03 0,08 0,11 0,13 0,15 0,22 0,22
TX_SSDIPL0 0,19 0,04 0,11 0,16 0,18 0,22 0,30 0,23
TX_BAC 0,15 0,01 0,12 0,14 0,15 0,16 0,17 0,09
TX_BACP2 0,24 0,06 0,13 0,20 0,24 0,28 0,36 0,26
revenu par ménage 23263,05 2449,73 17962,80 21786,94 23258,10 24532,64 31792,90 0,11
PartMenagesNonImposables 40,81 5,62 27,36 37,62 40,26 43,20 54,29 0,14
UsageQuotidienTabac17ans% 34,44 2,48 25,00 33,00 34,00 36,00 40,00 0,07
VentesCig_hab 832,55 156,96 559,00 772,00 862,00 921,00 1172,00 0,19
VenteTabac_kg_hab 128,65 44,03 58,40 107,60 118,20 171,40 211,80 0,34
DecesTabac65par1000hab40-64 5,93 0,71 4,60 5,20 5,90 6,60 7,00 0,12
MEAN_O3_1 26,40 5,84 14,00 23,17 25,97 29,60 41,21 0,22
Les boites à moustache pour représenter l’étendue et la concentration des individus dans la distribution
une vision rapide du comportement de plusieurs caractères dans une population
Comparer la moyenne des P5 et P95
journaliers en NO2 (ordre de grandeurs ≠)
−2 0 2 4 6
Pneum_Hbt Ruuto_BPCO TMinJanv TX_P06_CHOM1564
V a le ur s
4 Indicateurs pour l'étude de la pollution et de la santé dans les UU
Représenter graphiquement une distribution statistique
Pour un caractère discret : diagramme en bâtons
Pour un caractère continu : histogramme
0 5 10
−2 0 2 4 6
TMinJanv
Nbre de villes UU
Température min de janvier dans les UU
Taux standardisé de Bronchopneumopathies dans les UU
Taux standardisé
Fréquence
0.0 0.5 1.0 1.5 2.0 2.5 3.0
05101520253035