Une nouvelle classe de modèles auto-régressifs à valeurs entières

216 

Texte intégral

(1)

HAL Id: tel-00442146

https://tel.archives-ouvertes.fr/tel-00442146

Submitted on 18 Dec 2009

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Maher Kachour

To cite this version:

Maher Kachour. Une nouvelle classe de modèles auto-régressifs à valeurs entières. Mathématiques

[math]. Université Rennes 1, 2009. Français. �tel-00442146�

(2)

THÈSE / UNIVERSITÉ DE RENNES 1

sous le s eau de l'Université Européenne de Bretagne

pour obtenir legrade de

DOCTEUR DE L'UNIVERSITÉ DE RENNES 1

Mention:Mathématiques et Appli ations

É ole do torale MATISSE

présentée par

Maher KACHOUR

préparée àl'UMR 6625 CNRS - IRMAR

Institut de Re her he Mathématique de Rennes

U.F.R. de Mathématique

Intitulé de la thèse

Une nouvelle lasse

de modèles

autorégressifs

à valeurs entières

Thèse soutenue à Rennes

le 9Dé embre 2009

devant lejury omposé de :

Jean-Mar BARDET Professeur

Université de Paris 1 Examinateur

Dominique DEHAY Professeur

Université de Rennes 2 Examinateur

Bernard DELYON Professeur

Université de Rennes 1 Examinateur

Christian FRANCQ Professeur

Université de Lille3 Rapporteur

Anne PHILIPPE Professeur

Université de Nantes Examinateur

Jian-Feng YAO Professeur

(3)
(4)
(5)
(6)
(7)
(8)

Je tiens à remer ier en tout premier lieu le Professeur Jian-Feng Yao, mon dire teur

dethèse,quiasu melaisserlaliberténé essaireàl'a omplissement demestravaux, tout

en gardant un ÷il ritique et avisé. La onan e que vous m'avez a ordée ainsi que nos

nombreusesdis ussionsm'ontpermisdeprogresser etdemieuxappréhenderlesdiérentes

fa ettesdu métierd'enseignant- her heur.

Mes remer iements vont également à F. Jay Breidt et Christian Fran q, je suis très

tou hé de l'honneur que vous me faites en a eptant de juger e travail et d'en être les

rapporteurs. Veuillez a epterl'expression dema plusprofondegratitude.

Je présente toute ma re onnaissan e à Anne Philippe, Jean-Mar Bardet, Dominique

Dehay etBernard Delyon, pour avoir a epté d'examiner ma dissertation do torale etde

fairepartie demonjurydethèse.Soyez assurés,Madame, Messieurs,detoutemonestime

etde monprofondrespe t.

Je voudraisadresserunremer iementàtouslespersonnelsdel'UFRde Mathématique

et de l'IRMAR, pour leur ompéten e, leur é oute, leur gentillesse et leur disponibilité.

Je pense parti ulièrement à Claude Bos het (maman Claude), Marie-Aude Verger,

Hé-lèneRousseaux,KarineFal 'Hon,ChantalHalet,Marie-Anni kPaulmier,ClaudineHelies,

DominiqueHervé etPatri k Perez.

Je ne sais omment exprimer ma gratitude à tous les enseignants ave qui j'ai

olla-boré pendant es troisannées. Je vous remer ie haleureusement pour votre onan e. Je

souhaite évidemment remer ier toutes les personnes ren ontrées, lors des manifestations

s ientiques,pour l'intérêt qu'elles ont portéà montravail.

Laréalisation de ette thèsefutaussil'o assion d'uneaventurehumaine merveilleuse.

Au ours de es trois dernières années, j'ai roisé la route de nombreuses personnes. Je

re onnais que ha unea, à des degrés divers, apporté une ontribution positive à ma vie

(9)

nosdis ussions,nosnuitsblan hesetnosfousrires.Jetiensàremer ierégalementMatthieu

et Marianne ainsi que tous les membres de la famille Saumard, votre hospitalité me fait

haud au ÷ur.

"Les amis sont la famille que nous hoisissons" et au sein de l'IRMAR j'ai trouvé

une grande famille. Ainsi, mes plus vifs remer iements s'adressent à Christian Naumovi

(naumov), Frédérique le Louër (fred), Nirmal Antonio Tamarasselvame (nini), Arnaud

Jobin (jobinho), Ni olas Bideau (ni o), Solena Bravo-Pinto (tata), Vi tor Péron (toto),

JonathanMar o(johnny),Ludovi Goudenège(lep'titludo),AdrienRi hou(lels a héde

B.D.),ThomasSiero inski,AudreyHouillier(les gensdunord), AlinaCrudu( hou- hou),

Polyni eEyi(poly),RodolpheRi hard ( oee-man),JimmyLamboley(salsa-man),

Anne-Claire Bennis( a ahuète),Colas Bardavid (me àla ool), etGéraldinePi hot (gerald).

Mer i lesami(e)spourvotreé oute,vosen ouragements, vos onseils etsurtout pourtous

les momentsde bonheur partagés.

Je remer ie de plus tous eux qui sont passésun jour prendre un aféau bureau 434,

eux que je n'ai pas eu la han e de toyer plus souvent, et eux ave qui j'ai partagé

le repas de midi au restaurant universitaire. Mer i à tous les autres do torants pour le

monde parallèle qui s'est rééautour de leurjeu de hasard. Grâ e à vous, j'ai réalisé que

l'ouverture 'est omprendreladivergen e despointsde vue.

Je salue aussi les an iens et les nouveaux do torants. Ainsi, je tiens à exprimer ma

profonde gratitude à toutes les personnes queje n'ai pas itées i i etqui se re onnaîtront

dans es quelqueslignes.

Loin de la tour des maths, j'exprime toute mon amitié à Bilal Nehmeh, Mohamad

Muhieddine, Ayman Khalil, Hassan Sabbah, Hussein Sabbah, Carole Cabreton, Benoît

Patra,etTassaditAbid. Jem'ex useauprès detoutes lespersonnesquej'appré ieet dont

le nom n'apparaît pas dans ette page. Je ne sauraispas les iter toutes sans dépasser le

nombre depages raisonnablement admisdans egenre de travail.

Une pensée émue pour tous les étudiants ave qui j'ai partagé une salle pendant es

troisannées. Mer ipour votre onan e etvotresoutien.

Celava de soi,je remer ie évidemment mafamille pour son irremplaçable et

in ondi-tionnelsoutien.Ilsontétéprésents,malgréladistan e,pouré arterlesdoutes,soignerles

blessures et partager les joies. Il m'est impossible d'exprimer toute ma re onnaissan e et

(10)

En verité, le hemin importe peu, la volonté d'arriver sut à tout.

(11)
(12)

Lesséries hronologiquesàvaleursentièressontfréquemmentutiliséesdanslapratique.

Citonsquelquesexemples :nombre destransa tions hebdomadairesd'un titreboursier, la

température quotidienne à Rennes pendant et été, le alibrage d'unfruit donné, et bien

d'autres.

Avant lan des années

70

de telles observations étaient traitées par des modèles réels (parexemple,ARMA,VAR,ARCH,...) bien onnus dans lalittérature,sanstenir ompte

dela natureentièrede esobservations.

Unepremièretentativedemodélisationdesséries hronologiquesàvaleursentièresestdue

à Ja obs

&

Lewis (1978). Leur modèle peut être dé rit omme une ombinaison linéaire aléatoire de variables aléatoiresi.i.d.dis rètes.

Plustard, desauteurs tels M Kenzie (1985), Al-Osh

&

Alzaid(1987) etbiend'autresont introduitdes lassesde modèlesqui possèdent lesmêmesstru turesde orrélationquedes

modèles réels, toutenrespe tant laparti ularité entièredesséries observées.

Eneet,pour onstruiretelsmodèleslesauteursontrempla élamultipli ationusuelledans

lesmodèles réels(parexemple dansun modèleAR(p)) par unopérateur d'amin issement

(parexemple l'opérateur d'amin issement binomial de Steutel

&

Van Harn(1979)). Cependant, e rempla ement fait apparaître plusieurs ontraintes limitant l'utilisation de

résultatsdéjà onnus pour les modèles réels.

Au oursde ettethèse,notreintérêts'esttournéuniquementverslare her hedes

nou-velles lasses de modèles autorégressifsàvaleursentières. Dans e but,nousnoussommes

baséssurl'opérateur d'arrondiàl'entierleplusprès,pour onstruire lemodèleRINAR(p)

(pourp-orderroundedinteger-valuedautoregressif).L'idéedela onstru tionde edernier

estsimple,ilsut de ensurer(enutilisantl'opérateur d'arrondi)lafon tion derégression

linéaired'unpro essusAR(p)ayant ommebruit unesuitedevariablesaléatoires entrées

(13)

Ainsi, par onstru tion les modèles proposésexploitent undomaine rarement examiné :la

modélisationdesséries hronologiques àvaleursentièresayantdesobservations négatives.

Notonsqu'engénérallespro essusbaséssurlesopérateursd'amin issementsontappropriés

pour la modélisation des séries hronologiques à valeurs entières positives, en parti ulier

lessériesde omptage.Par ailleurs, omparésauxmodèlesexistantsdanslalittérature es

nouveauxmodèles possèdent plusieurs avantages.

Aprèsunebrèveprésentationdequelquesmodèlesautorégressifsàvaleursentièresbasés

sur lesopérateurs d'amin issement, noussus itonsleurs limitations, etnousargumentons

l'introdu tiondelanouvelle lassedemodèlesbaséssurl'opérateurd'arrondi(Chapitre1).

Noustraitons,dansleChapitre2,lemodèleRINARdupremierordre. Le modèleRINAR

d'ordre supérieurestexaminédansleChapitre 3.DansleChapitre4,nousétudionsle

mo-dèle RINAR ve toriel approprié pour analyser les séries hronologiques à valeurs entières

multivariées. Le Chapitre 5 est onsa réà l'étude du modèle RINAR entré. Finalement,

dans leChapitre 6,nous présentons le modèle PRINARdédié à l'analyse desséries

hro-nologiques àvaleursentières positives.

Il est toujours aisé d'être logique. Il est presque impossible

d'être logique jusqu'au bout.

(14)

1 Introdu tion 1

1.1 Lesopérateursd'amin issement . . . 3

1.2 Quelquesmodèles basés surlesopérateursd'amin issement . . . 6

1.2.1 LemodèleINAR(1) . . . 6 1.2.2 LemodèleINAR(p)-AA . . . 9 1.2.3 LemodèleINAR(p)-DL . . . 10 1.2.4 LemodèleGINAR(p) . . . 11 1.2.5 LemodèleMGINAR(p) . . . 12 1.3 Contributions de lathèse . . . 13

1.3.1 Critiquesdesmodèles basés surlesopérateurs d'amin issement . . . 13

1.3.2 Intérêtsdes modèles introduits . . . 14

1.3.3 Plande lathèse. . . 16

2 Le modèle RINAR(1) 19 2.1 Quelquesdénitions . . . 20

2.2 Stationnaritéetergodi ité dupro essusRINAR(1) . . . 24

2.3 Propriétés dupro essusRINAR(1) . . . 26

2.4 Estimationdesparamètres . . . 29

2.4.1 La onsistan e forte de l'estimateur des moindres arrés quand le oe ient derégression

α

0

estirrationnel . . . 34

2.4.2 La onsistan e forte de l'estimateur des moindres arrés quand le oe ient derégression

α

0

estrationnel . . . 43

2.5 Méthodenumérique pour al uler

ˆ

θ

n

. . . 57

2.5.1 Initialisation . . . 58

(15)

2.5.3 Étude de simulation . . . 61

2.6 Analyse desdonnéesd'O'Donovan . . . 65

2.6.1 Le modèle AR(1)d'O'Donovan . . . 67

2.6.2 Ajustementà un modèleRINAR(1) . . . 69

2.6.3 Comparaison et ommentaires . . . 71

2.7 Analyse destauxde variationannuels delapopulationSuédoise . . . 71

2.7.1 Ajustementà un modèleAR(1) . . . 74

2.7.2 Ajustementà un modèleRINAR(1) . . . 74

2.7.3 L'appro he deM Cleary

&

Hay . . . 76

2.7.4 Comparaison et ommentaires . . . 77

3 Le modèle RINAR(p) 79 3.1 Stationnarité etergodi itédu modèleRINAR(p) . . . 80

3.2 Estimation desparamètres . . . 84

3.2.1 La onsistan e forte de l'estimateur des moindres arrés quand un au moinsdes oe ientsde régression

α

j

est irrationnel . . . 91

3.2.2 La onsistan eforte de l'estimateurdesmoindres arrésquand tous oe ients derégression

α

j

sontrationnels . . . 95

3.3 Méthode numérique pour al uler

ˆ

θ

n

. . . 104

3.3.1 Initialisation . . . 104

3.3.2 Re her he di hotomique su essive . . . 104

3.3.3 Une expérien edesimulation . . . 106

3.4 Analyse desdonnéesde Fürth . . . 110

3.4.1 Le modèle INAR(2)de Jung

&

Termayne . . . 111

3.4.2 Ajustementà un modèleRINAR(2) . . . 112

4 Le modèle RINVAR(1) 117 4.1 Stationnarité etergodi itédu modèleRINVAR(1). . . 118

4.2 Estimation desparamètres . . . 122

4.2.1 La onsistan efortedel'estimateurdesmoindres arrésquand haque ligne de lamatri e

M

0

possède un oe ient irrationnel . . . 127

4.2.2 La onsistan eforte de l'estimateurdesmoindres arrésquand tous les oe ientsde lamatri e

M

0

sont rationnels . . . 130

(16)

4.2.3 La onsistan e forte de l'estimateur des moindres arrés quand au

moins une ligne de la matri e

M

0

possède au moins un oe ient

irrationnel . . . 134

4.3 Méthodenumérique pour al uler

θ

ˆ

n

. . . 137

4.4 Analysedestauxdevariationetlesindi esde ré olteannuelsdela popula-tionSuédoise . . . 138

4.4.1 L'appro he de M Cleary

&

Hay . . . 139

4.4.2 Ajustement à unmodèle RINVAR(1) . . . 140

4.4.3 Comparaisonet ommentaires . . . 142

5 Le modèle RINAR(1) entré 145 5.1 Quelquesdénitions . . . 146

5.2 Étude dumodèle RINAR(1) entré . . . 148

5.2.1 Stationnaritéetergodi ité dupro essusRINAR(1) entré . . . 149

5.2.2 Estimationdu paramètre

α

. . . 149

5.3 Propriétés dupro essusRINAR(1) entré . . . 150

5.3.1 Comparaisonave unAR(1) entré . . . 153

5.3.2 Étude desimulation . . . 155

5.4 Méthodenumérique pour al uler

α

ˆ

n

. . . 160

5.5 LemodèleRINAR(1) re entré . . . 163

6 Le modèle PRINAR(1) 165 6.1 Introdu tion . . . 166

6.2 Étude théorique dupro essusPRINAR(1) . . . 167

6.3 Propriétés dupro essusPRINAR(1) . . . 168

6.3.1 Lepro essus PRINAR(1)re entré . . . 171

6.3.2 Étude desimulation . . . 172

6.4 Supportde laloi stationnaire . . . 177

Con lusionet perspe tives 179

Table des gures 185

(17)
(18)

Introdu tion

Sommaire

1.1 Les opérateurs d'amin issement. . . 3

1.2 Quelquesmodèlesbasés sur lesopérateurs d'amin issement. . 6

1.2.1 LemodèleINAR(1) . . . 6 1.2.2 LemodèleINAR(p)-AA . . . 9 1.2.3 LemodèleINAR(p)-DL . . . 10 1.2.4 LemodèleGINAR(p) . . . 11 1.2.5 LemodèleMGINAR(p) . . . 12 1.3 Contributions de la thèse. . . 13

1.3.1 Critiquesdesmodèlesbasés surlesopérateursd'amin issement . 13 1.3.2 Intérêtsdesmodèlesintroduits . . . 14

1.3.3 Plandelathèse . . . 16

Dans ertainessituations ildevient né essairede traiterles séries hronologiques à

va-leursentières.Cesdernièrespeuventseproduiredansbeau oupdedomaines,par exemple,

dans la théorie d'assuran e, la méde ine, les systèmes de les d'attente, les

ommuni a-tions, la abilité, la météorologie, et bien d'autres. Les pro essus de omptage sont des

exemplesde esséries hronologiqueset e qu'ils omptentdièred'unpro essusàl'autre.

Ceux- ipeuvent êtreles nombresd'a idents, patients, vi timesde rime,messages

trans-mis,erreursdéte tées,etainside suite(voirpar exemple,Johansson(1996, [36 ℄),Freeland

(1998,[25℄),Yeetal.(2001,[65 ℄),Pokroppetal(2006,[56 ℄),LambertandLiu(2006,[45 ℄),

Jung etal.(2006, [37 ℄)etWeiÿ(2008,[62℄)).

Au premier regard, l'analyse de telles séries hronologiques peut présenter quelques

(19)

reéterlaparti ularitéentièredelasérieobservée.Pour etteraison,nouspréféronsnepas

onsidérer,à titred'exemple,unpro essusautorégressifà valeursréelles,pouranalyser de

telles observations. Rappelons que les modèles lassiquestels ARMA,ARCH etd'autres,

bien onnus dansla littérature, génèrent desobservations réelles (voir Bro kwell et Davis

(2002, [12℄)).

La re her he des modèles sto hastiques pour des observations à valeursentières a

dé-butéeàlandesannées1970.Ja obs

&

Lewis(1978et1983,[32 ℄[33 ℄et[34℄)ontintroduit la première lasse de modèles, notée DARMA. Cette dernière peut être dé rite omme

une ombinaison linéaire aléatoire de variables aléatoires i.i.d. dis rètes. L'appro he de

Ja obs-Lewis peut être onsidérée omme analogue à elle de Box-Jenkins dans laquelle

la ombinaison linéaire des valeursréelles est rempla ée par un mélange probabiliste. Les

pro essus DARMA permettent de traiter lespro essus prenant un nombre ni de valeurs

et, plusparti ulièrement,les sériesbinaires.

Lespremierspro essussto hastiquesàvaleursentièresdontlespropriétéssontsimilaires

à elles desmodèles réels lassiquessont dus à M Kenzie (1985, [50 ℄)etAl-Osh

&

Alzaid (1987, 1990,[2℄,[6 ℄).Ces modèlessontbaséssurl'opérateurdeSteutel

&

VanHarn(1979, [59℄).DansAl-Osh

&

Alzaid(1990,[6℄),lepro essusINAR(p)(pourpro essusAR(p)à va-leursentières)possèdeunestru turede orrélationsimilaireà elledupro essusARMA(p,

p-1). Du

&

Li (1991, [21 ℄) ont suggéré une autre spé i ation du modèle INAR(p) dont la stru ture de orrélation est identique à elle du pro essus AR(p) standard. Gauthier

&

Latour (1994, [30 ℄) et Latour (1998, [47 ℄) ont onsidéré une version plus générale du modèle, noté GINAR(p), basée surl'opérateur généraliséde Steutel

&

Van Harn. Latour (1997,[46℄)aintroduitlemodèleMGINAR(p),basésurl'opérateurmatri ielgénéraliséde

Steutel

&

Van Harn, pour les séries hronologiques àvaleursentièresmultivariées.

Les modèles à moyenne mobile à valeurs entières, notés INMA(q), sont basés aussi sur

l'opérateur de Steutel

&

Van Harn.Le pro essusINMA aétéétudié par M Kenzie (1988, [52℄). Al-Osh

&

Alzaid(1988, 1991,[3℄, [4℄) ont proposéune autre spé i ation.Pour une omparaison entrelesdeuxspé i ations,nousnousréféronsàBrännäsetHall(2001,[9 ℄).

Pour unerevue ré ente surlesmodèlesde série hronologiqueà valeursentièrespossédant

la même stru ture de orrélation que la lasse ARMA, nous nous référons à Kedem et

Fokianos(2002, [44℄),M Kenzie (2003, [53 ℄)etJung etTermayne (2006, [40℄).

(20)

on er-traitentlemodèlebilinéairesimpleàvaleursentières.Cesmodèlessontbaséssurl'opérateur

d'amini issement généralisé.

Dans e hapitre,nousintroduisonslesopérateursd'amin issement,enparti ulier

l'opé-rateurd'amin issementbinomialdeSteutel

&

VanHarn(1979,[59 ℄).Àlasuite,nous énon-çonsquelques lasses de modèlesautorégressifsà valeursentières, baséssurles opérateurs

d'amin issement :notamment,lesmodèlesINAR(p),lesmodèlesGINAR(p)etlesmodèles

MGINAR(p).En onséquent,nous itonsleslimitesde esmodèles etnousprésentonsles

motivations etles intérêtsd'introduire une nouvelle lasse demodèles autorégressifsà

va-leurs entières, baséssurl'opérateur d'arrondi àl'entier leplus près.

Finalement,nous donnonsleplande lathèse.

1.1 Les opérateurs d'amin issement

Pourobtenirunestru turede orrélationanalogueà elledela lasseARMA,beau oup

demodèles utilisent des opérations d'amin issement.

L'opérateur d'amin issement (thinning operator)le plus onnu est elui de Steutel

&

VanHarn(1979, [59 ℄). Cedernierest appelé l'opérateur d'amin issement binomial.

Dénition1.1.1. (L'opérateur

deSteutel

&

VanHarn).Soit

k

)

une suitedevariables aléatoiresindépendantes,identiquementdistribuéesselonuneloi deBernoullideparamètre

a ∈ [0, 1]

et indépendante de

Z

, une variable aléatoire à valeurs entières positives. L'opérateur d'amin issement,noté

, est déni par

a ◦ Z =

Z

X

k=1

ξ

k

.

Nousappelonslasuite

k

)

unesériede omptage.Par onséquent, onditionnellement à

Z

lavariablealéatoire

a ◦ Z

suit une loibinomial de paramètres

Z

et

a

.

Pour l'interprétation de l'opérateur d'amin issement binomial, onsidérez une population

detaille

Z

,àunmoment

t

.Sinousobservonslamêmepopulationàunmomentpostérieur, dit

t + 1

, alors la population peutêtre diminuée, par e que ertains individussont morts entrelesmoments

t

et

t + 1

.Siles individusmeurent indépendamment les uns desautres, etsilaprobabilitédemourirentre

t

et

t + 1

estégaleà

1−a

pourtouslesindividus,alorsle nombre dessurvivantsestdonnépar

a ◦ Z

.Maintenant, nousdonnonsquelquespropriétés

(21)

de basede l'opérateur d'amin issement binomial.

E[a ◦ Z] = a E[Z],

V [a ◦ Z] = a

2

V [Z] + a (1 − a) E[Z],

cov[a ◦ Z, Z] = a V [Z].

(1.1)

Pour unepreuveexpli ite de esdernières etbiend'autres propriétésnousnousréféronsà

Freeland(1998, [25℄)etda Silva(2005, [14 ℄).

Enfait, le on eptd'amin issement binomialaétéintroduitpouradapterlestermesde

la lassedesdistributionsauto-dé omposablesdis rètes,notéeDSD(dis reteself-de omposable).

Rappelons qu'unedistribution sur

R

estditeauto-dé omposable oude lasse

L

sisa fon -tion ara téristique

ϕ

satisfait(voirpar exemple,Luka s(1970, [48 ℄), page 161)

ϕ (t) = ϕ (α t) ϕ

α

(t), t ∈ R

et

α ∈ [0, 1],

(1.2)

ϕ

α

est une fon tion ara téristique. Ce i implique que, pour les variables aléatoires orrespondantes, nousavons

X

= α X

d

+ X

α

ave

α ∈ [0, 1],

(1.3)

X

et

X

α

sont indépendantes et

X

a lamême distribution que

X

.

Dénition 1.1.2. Unedistributionsur

N

ave unefon tiongénératri e

P

est diteDSDsi

P (z) = P (1 − a + az)P

a

(z) |z| ≤ 1; a ∈ [0, 1],

(1.4)

ave

P

a

une fon tiongénératri e.

Dénition 1.1.3. Une variable aléatoire

Z

à valeurs dans

N

est dite DSD si pour tout

a ∈ [0, 1]

, il existe une variablealéatoire dis rète

ε

a

,indépendante de

a ◦ Z

, telle que

Z

= a ◦ Z + ε

d

a

.

(1.5)

Nous pouvons mentionner i i que la lasse DSD est une sous- lasse assez large de la

lasse desdistributions dis rètesinniment divisible dénie ommesuit.

Dénition 1.1.4. Soit

Z

une variablealéatoire à valeurs dans

N

. Sa fon tiongénératri e

P

X

(z)

estditeinnimentdivisiblesi

(P

X

(z))

1

n

est elle-mêmeunefon tiongénératri e pour

tout

n ∈ N

(22)

Feller (1968, [23 ℄) a montré qu'une distribution sur

N

est inniment divisible, si et seulement si elle estune distribution dePoisson omposée.

Notonsquebeau oupdedistributions,y omprisbinomialNégative,PoissonetPoisson

généralisée (les propriétés de ette distribution ont été étudiée par Consul (1989, [13℄) et

Ambagaspitiya et Balakrishnan (1994, [8 ℄)), appartiennent à la lasse des distributions

DSD (voir Zhu and Joe (2003, [67 ℄)). En parti ulier, ette dernière ontient la lasse des

distributions dis rètes stables et tous es éléments sont unimodales (voir Steutel

&

Van Harn(1979, [59 ℄)).

Pour adapter le on ept d'amin issement binomial à diérents typesd'interprétations

ou des pro essus, quelques modi ations on ernant les hypothèses de la Dénition 1.1.1

ont été proposées. Brännäsand Hellström (2001, [10 ℄) ont proposé de tenir ompte de la

dépendan eentrelesindi ateursdelasériede omptage

k

)

delaDénition1.1.1,puisque esindi ateurs peuvent représenter desindividus dansle même milieu ma ro-é onomique

etdon ae tésde lamême façon.

Une autre généralisation de l'opérateur d'amin issement binomial a étéproposée par

La-tour (1998, [47 ℄). I i, les éléments de la série de omptage

ξ

k

de la Dénition 1.1.1 sont des variables aléatoires à valeurs dans

N

de moyenne

a ∈ [0, 1]

et varian e nie

λ

(voir Se tion 1.2.4). Cette opération est onnue sous le nom d'amin issement généralisé. Elle

peut être interprétée omme un pro essus de reprodu tion qui permet aux individus de

se reproduire plus d'une fois ( omme dans le as d'amin issement binomial) : les

ξ

k

dé-signe le nombre de des endants d'une ertaine personne, y ompris éventuellement et

individu lui-même. L'opérateur d'amin issement généralisé omprend l'amin issement

bi-nomial omme asparti ulier(

λ = a (1−a)

),ainsiquel'opérateurd'amin issement étendu (extendedthinning) proposépar Zhuand Joe (2003,[67 ℄). Notons qu'en utilisant

l'opéra-teurd'amin issement étendu, les auteurs (2003, [67℄) ont déni la lassedes distributions

dis rètes auto-dé omposable généralisée, notée DSD (

γ

) où

γ ∈ [0, 1[

. Notons que, les lasses DSD (

0

) et DSD ont les mêmes propriétés et tous les éléments de la lasse DSD (

γ

) sont inniment divisibles. Deplus, l'opérateur d'amin issement généralisé possède les mêmespropriétés que l'opérateur d'amin issement binomial.

D'autrepart, Joe(1996, [35℄)etZheng etal.(2007, [66 ℄)ont proposéd'étendrele on ept

d'amin issement en permettant au paramètre

a

de laDénition 1.1.1 d'êtrealéatoire lui-même.Ainsi,l'opérationd'amin issementrésultanteestdited'amin issement à oe ient

(23)

1.2 Quelques modèles basés sur les opérateurs

d'amin isse-ment

La première lasse de modèles autorégressifs à valeurs entières, notée INAR, a été

introduitepar M Kenzie (1985, [50℄)etAl-Osh

&

Alzaid(1987, 1990, [2 ℄,[6℄). Dénition 1.2.1. Soit

{X

t

}

t∈Z

, une suite de variables aléatoires à valeurs entières posi-tives;

t

}

t∈Z

, une suite devariables aléatoires i.i.d. à valeurs entières positives

p ∈ N

et

{a

j

}

j∈{1,2,··· ,p}

, une suite de onstantes telles que

∀ j, 0 ≤ a

j

< 1

(

a

p

> 0

). Alors,

{X

t

}

t∈Z

est unpro essus INAR(p)si

X

t

=

p

X

j=1

a

j

◦ X

t−j

+ ε

t

, ∀ t ∈ Z.

(1.6) 1.2.1 Le modèle INAR(1)

Le modèleINAR(1) aétéétudié par Al-Osh

&

Alzaid(1987, [2℄).Ainsi, e dernier est déni par

X

t

= a ◦ X

t−1

+ ε

t

, ∀ t ∈ Z,

où lebruit

t

)

estunesuite devariables aléatoiresi.i.d.àvaleursdans

N

,ave

t

= λ

et

V (ε

t

) = σ

2

.Ainsi, nousavons

a ◦ X

t−1

=

X

t−1

X

k=1

ξ

k

,

(1.7)

k

)

estunesuitedevariablesaléatoiresindépendantes,identiquement distribuéesselon uneloideBernoullideparamètre

a ∈ [0, 1]

,indépendantede

X

t−1

et

t

)

estindépendante de

k

)

.Par onséquent,

(a ◦ X

t

| X

t

)

suit une loi binomialde paramètres

X

t

et

a

.

Nouspouvons onsidérer uneréalisation

X

t

omme ayant deux omposantes:leséléments survivantsde

X

t−1

,ave uneprobabilitédesurvie

a

pour ha un,etlesélémentsquientrent dans le systeme, dans l'intervalle

]t − 1, t]

(le terme d'innovation

ε

t

). Ainsi, le modèle INAR(1)peutêtre onsidéré ommeunpro essusdebran hement deGalton-Watson ave

immigration. Pour une dénitionetundéveloppement historique de e dernier,nousnous

référons àHeyde et Seneta(1972, [31℄).Finalement, le modèle INAR(1)est également lié

à laled'attente

M/M/∞

(voir M Kenzie(1988, [52℄)).

Ave esinterprétations,lemodèleINAR(1)s'appliqueàdenombreusessituationsdans

lapratique.Àtitred'exemple,

X

t

peutdé rirelenombre de lients.

ε

t

dé ritles nouveaux lients, et

X

t−1

− a ◦ X

t−1

estlenombrede lientsquiontétéperdusàlande ladernière

(24)

période. Brännäs etal. (2002, [11℄)ont utilisé ette approa he pour modéliser le nombre

des lientsd'unhtel.

Sousl'hypothèse

0 ≤ a < 1

,la stationnaritéd'INAR(1)est assurée. Lesmomentsdu premieretse ond ordredu modèle sont

EX

t

=

λ

1 − a

et

V (X

t

) =

σ

2

+ λa

1 − a

2

.

(1.8)

Deplus, beau oup deses propriétés sont similairesà ellesdu pro essusAR(1)standard.

Enparti ulier, lafon tiond'auto orrélation(ACF) vaut

ρ(k) ≡ corr (X

t

, X

t−k

) = a

k

, ∀ k ∈ N.

(1.9)

Ainsi,l'estimateur de Yule-Walkerpourle paramètre

a

n'est autrequele oe ient d'au-to orrélationempirique depremier ordre, .à.d.,

ˆ

a = ˆ

ρ(1)

(1.10)

L'estimationde Yule-Walkerde

λ

estbasée surlemoment dupremier ordre, .à.d.

ˆ

λ = ¯

X(1 − ˆa),

X

¯

estla moyenne empirique

.

(1.11)

Laprévisionàunpasàl'instant

T

,baséesurl'espéran e onditionnelle,estlinéaire( omme pour un AR(1)réel)etdonnéepar

ˆ

X

T

+1

=

E (X

T

+1

| F

T

) = aX

T

+ λ,

F

T

= σ {X

T

, X

T

−1

, · · · } .

(1.12)

Finalement,la probabilitéde transitiondupro essusINAR(1) estdonnéepar

P [X

t+1

= k | X

t

= l] =

min(k,l)

X

j=0

l

j

a

j

(1 − a)

l−j

P(ε

t

= k − j).

(1.13)

D'autre part,Al-Osh

&

Alzaid(1988, [5 ℄)ont al ulélafon tion génératri e de

X

t

P

Xt

(s) = P

X0

(1 − a

t

+ a

t

s)

t−1

Y

k=0

P

ε

(1 − a

k

− a

k

s), |s| ≤ 1,

(1.14)

P

ε

estla fon tiongénératri e de

ε

1

.Puisque

E[ε

1

] < ∞

,lalimite

lim

t→∞

P

Xt

(s)

existe etvaut

P

X

(s) =

Y

k=0

P

ε

(1 − a

k

− a

k

s), |s| ≤ 1.

(1.15)

Par ailleurs, à partir delaDénition 1.2.1 (pour

p = 1

) ilest simplede vérierque

(25)

X

estune variable aléatoire ayant ommedistribution la loi stationnairedu pro essus INAR(1).D'autrepart,l'équation(1.16)estliéeàladénitiondela lassedesdistributions

auto-dé omposablesdis rètes,notée DSD(voirSe tion 1.1). Ainsi,nous onstatonsquela

distribution marginale du modèlestationnaire INAR(1)est unélément de la lasseDSD.

Notons que,Al-Osh

&

Alzaid(1987, [2℄)ontprésentélaloimarginale dumodèleINAR(1) en fon tion destermesdu bruit

t

)

,

X

t

=

d

X

j=0

a

j

◦ ε

t−j

.

(1.17)

Ainsi,sousl'hypothèseoù

ε

t

suituneloidePoissondeparamètre

λ

( .à.d.

ε

t

P o(λ)

,

t

= V (ε

t

) = λ

), la loi stationnaire de la haîne de Markov

(X

t

)

est aussi de Poisson de paramètre

λ

1 − a

. Par onséquent,

EX

t

= V (X

t

) =

λ

1 − a

et e modèle sera appelé PoINAR(1).Pour d'autrespropriétés on ernant edernier,nousnousréféronsàFreeland

(1998, [25℄), Freeland etM Cabe (2004, 2005,[26℄, [27℄) etWeiÿ(2008, [63 ℄).

Une loi de Poisson n'est pas toujours appropriée à la modélisation et l'analyse des

séries hronologiques à valeurs entières. C'est par e que la moyenne et la varian e de la

distribution de Poisson sont égales et que ette propriété n'est pas toujours vériée pour

desdonnéesréelles.Autresdistributionsmarginalespossiblespourlepro essusstationnaire

INAR(1) sont la loi binomial Négative (voir par exemple, Al-Osh etAly (1992, [1℄), Zhu

et Joe (2006, [68 ℄), et Weiÿ(2008, [64℄)), la loi géométrique (voir par exemple, M Kenzie

(1986, [51 ℄) et Risti¢ et al. (2008, [58℄)), et la loi de Poisson généralisée (voir Alzaid et

Al-Osh (1993, [7℄)).

Soit

X

1

, · · · , X

d

une série hronologique à valeurs dans

N

, la loi marginale peut être identiée à l'aide de l'histogramme, et l'ordre du modèle ave la fon tion

d'auto orréla-tion empirique. D'ailleurs, Jung et Tremayne (2003, [39℄) ont fourni des appro hes pour

examiner ladépendan e entre lesobservations.

Une foisque lemodèle INAR(1)a étéidentié omme appropriépour lasérie

hrono-logique

X

1

, · · · , X

d

, l'estimation des paramètres du modèle peut être faite, entre autres, par les trois appro hes suivantes : la méthode des moments (MM), les moindres arrés

onditionnel (MCC), et le maximum de vraisemblan e (MV). Pour une étude

(26)

1.2.2 Le modèle INAR(p)-AA

Maintenant, nous onsidérons lepro essusINAR(2),déni par

X

t

= a

1

◦ X

t−1

+ a

2

◦ X

t−2

+ ε

t

, ∀ t ∈ Z,

oùlebruit

t

)

estune suite devariablesaléatoiresi.i.d.àvaleursdans

N

,ave

t

= λ

et

V (ε

t

) = σ

2

,

0 ≤ a

1

< 1

et

0 < a

2

< 1

.Par suite,nousavons

a

1

◦ X

t−1

=

X

t−1

X

k=1

ξ

1k

et

a

2

◦ X

t−2

=

X

t−2

X

k=1

ξ

2k

,

(1.18)

où la série de omptage

1k

)

(resp.

2k

)

) est une suite de variables aléatoires indépen-dantes, identiquement distribuées selon une loide Bernoulli de paramètre

a

1

(resp.

a

2

) et indépendante de

X

t−1

(resp.

X

t−2

).Deplus,

t

)

est indépendantede

1k

)

et

2k

)

. Le hoix desséries de omptage est ru ialpour déterminer lastru ture de orrélationdu

pro essus. Ainsi,nousdistinguons deux diérentesspé i ations.

Le modèle INAR-AA,aétéintroduitpar Al-Osh

&

Alzaid(1990, [6℄).

Ce dernier est une extension dire te du pro essus INAR(1). Pour assurer la

stationna-rité du modèle les auteurs supposent que

a

1

+ a

2

< 1

. I i, onditionnellement à

X

t

le ve teur

(a

1

◦ X

t

, a

2

◦ X

t

, X

t

− a

1

◦ X

t

− a

2

◦ X

t

)

suit une loi Trinomiale de paramètre

(X

t

; a

1

, a

2

, 1 − a

1

− a

2

)

. C'est une extension naturelle multivariée de l'hypothèse équiva-lente danslepro essus INAR(1)où

(a ◦ X

t

| X

t

) B(X

t

, a)

.

Il en dé oule que le modèle INAR(p)-AA possède une stru ture de orrélation similaire

à elle du pro essus ARMA(p, p-1). Sous l'hypothèse où

ε

t

suit une loi de Poisson de paramètre

λ

, la loi stationnaire de la haîne de Markov

(X

t

)

est ausside Poisson de pa-ramètre

λ

1 − a

1

− a

2

.Par onséquent,

EX

t

= V (X

t

) =

λ

1 − a

1

− a

2

, e modèlesera appelé

PoINAR(2)-AA.L'ACF dupro essusest donnéepar

ρ(1) = a

1

et

ρ(k) = a

1

ρ(k − 1) + a

2

ρ(k − 2),

pour

k ≥ 2.

(1.19)

Alors,les estimateurs de Yule-Walkerpour les paramètres

a

1

et

a

2

sont

ˆ

a

1

= ˆ

ρ(1)

et

ˆ

a

2

= ˆ

ρ(2) − ˆ

ρ(1)

2

.

(1.20)

Par onséquent,l'estimation deYule-Walker de

λ

est

ˆ

(27)

La fon tion de lamoyenne onditionnelle (régression) de emodèle estnon-linéaire.

E (X

t

| F

t−1

) = λ



1 + (a

1

+ U a

1

a

2

)

p(y − 1, z)

p(y, z)

+ a

2

p(y, z − 1)

p(y, z)

+ U a

2

1

p(y − 1, z − 1)

p(y, z)



,

F

t−1

= σ(X

t−1

, X

t−2

, · · · ), U = (1 − a

1

− a

2

)

−1

et

p(y, z) ≡ P(X

t−1

= y, X

t−2

= z) =

exp

[λ(a

1

− 2)U]

min(y,z)

X

i=0

[λU (1 − a

1

)]

y+z−2i

(λU a

1

)

(y − i)! (z − i)! i!

.

1.2.3 Le modèle INAR(p)-DL

Du

&

Li (1991, [21℄) ont présenté une nouvelle spé i ation du pro essus INAR(2), notéINAR(2)-DL.I i,les auteurssupposentqueles sériesde omptage

1k

)

et

2k

)

sont indépendantes. Lepro essusINAR(2)-DL eststationnaire si

a

1

+ a

2

< 1

.

Deplus, ils montrent que

EX

t

=

λ

1 − a

1

− a

2

.

Cependant,lavarian e

V (X

t

)

n'est pasen général égale à

λ/(1 − a

1

− a

2

)

.

Par onséquent,ladistributionmarginalede

(X

t

)

n'estplusdePoissonsilebruit

t

)

l'est. Par ontre, lastru utre de orrélation du pro essusINAR(p)-DL est identique à elle du

pro essusAR(p) réel.

Alors, lesestimateurs de Yule-Walkerpour lesparamètres

a

1

et

a

2

sont

ˆ

a

1

= ˆ

ρ(1)

 1 − ˆ

ρ(2)

1 − ˆ

ρ(1)

2



et

ˆ

a

2

=

ˆ

ρ(2) − ρ(1)

2

1 − ˆ

ρ(1)

2

.

(1.22)

Ainsi, l'estimation deYule-Walkerde

λ

est

ˆ

λ = ¯

X(1 − ˆa

1

− ˆa

2

),

¯

X

estla moyenne empirique

.

(1.23)

Deplus, lafon tion de régressiondu modèleINAR-DL estlinéaire

E (X

t

| F

t−1

) = a

1

X

t−1

+ a

2

X

t−2

+ λ.

(1.24)

(28)

indé-1.2.4 Le modèle GINAR(p)

Danslebutd'enri hirla lassedemodèlesautorégressifspermettantl'analysedesséries

hronologiques à valeurs entières, Gauthier

&

Latour (1994, [30 ℄) Dion et al. (1995, [18℄) et Latour (1998, [47℄) ont onsidéré une version plus générale du modèle INAR(p), noté

GINAR(p),basée surl'opérateur généraliséde Steutel

&

VanHarn (1979,[59 ℄).

Dénition 1.2.2. (L'opérateurd'amin issementgénéralisé, noté

a⋆

).Soit

Z

une variable aléatoireàvaleursentièrespositives;

ξ

,unevariablealéatoireàvaleursentièrespositivesde moyennenie

a

etdevarian enie

λ

et

k

)

unesuitedevariablesaléatoiresindépendantes entre elles, indépendantes de

Z

et distribuées selonla même loi que

ξ

.

Alors,l'opérateur

a⋆

est déni par

a ⋆ Z =

Z

X

j=1

ξ

k

.

La suite

k

)

est aussiune série de omptage. De plus, supposons que

b⋆

est unautre opérateur d'amin issement généraliséde

Z

,basé surune sériede omptage

k

)

.

Les opérateurs

a⋆

et

b⋆

sont indépendants si, et seulement si, les séries de omptage

k

)

et

k

)

sont mutuellement indépendantes.

Dénition 1.2.3. Soit

{X

t

}

t∈Z

, une suite de variables aléatoires à valeurs entières posi-tives;

t

}

t∈Z

,unesuitedevariablesaléatoiresi.i.d.àvaleursentièrespositivesdemoyenne nie

µ

ε

et de varian e nie

σ

2

ε

;

p ∈ N

et

{a

j

}

j∈{1,2,··· ,p}

, une suite de onstantes telles que

∀ j, 0 ≤ a

j

< 1 (a

p

> 0)

et

P

p

j=1

a

j

< 1

. Alors,

{X

t

}

t∈Z

est unpro essusGINAR(p)si

X

t

=

p

X

j=1

a

j

⋆ X

t−j

+ ε

t

, ∀ t ∈ Z.

(1.25)

I i, toutes les séries de omptage

jk

)

k∈N

asso iées à

a

j

pour

j = 1, 2, · · · , p

sont indépendantes entre elles et indépendantes de

ε

t

. Elles sont de moyenne nie

a

j

et de varian e nie

λ

j

. De plus, les auteurs (1994, [30℄) n'exigent pas qu'elles soient de type Bernoulli, e qui distingue nettement leurs résultats de eux de Du

&

Li (1991, [21 ℄). Le pro essusGINAR(p)possède unestru ture de orrélationidentiqueà elled'unpro essus

AR(p)réel.

Sousl'hypothèse

P

p

j=1

a

j

< 1

,le pro essusGINAR(p) est stationnaire. Notons queDion et al. (1995, [18℄) ont également établi la stationnarité du GINAR(p). Ces derniers ont

(29)

Ainsi, les moments depremier etse ond ordredu pro essusGINAR(p)sont

EX

t

=

µ

ε

1 −

P

p

j=1

a

j

= µ

X

.

(1.26) et

V (X

t

) = µ

X

p

X

j=1

λ

j

+

p

X

j=1

a

j

γ(j) + σ

2

ε

,

γ(j) = cov(X

t

, X

t+j

), ∀ t ∈ Z.

(1.27)

Con ernant l'estimationdesparamètresde epro essus,lesauteurs (1994,[30℄) ont donné

desrésultats similairesauxrésultats deDu

&

Li(1991, [21℄).

De plus, Latour (1998, [47 ℄) a montré que le orrélogramme, et par la suite la densité

spe trale, lorsque elle- i existe, du pro essus GINAR(p) (et par onséquent le pro essus

INAR(p)-DL) oïn ident ave euxd'un pro essus AR(p)réel.

Eneet, efaitn'estpas lairement dé larédanslalittérature.Àtitreexemple,dansDu

&

Li(1991,[21℄)ilesté ritqu'unpro essusINAR(p)estsimilaireàunpro essusAR(p).De

plus,Latour(1998,[47℄)adonnéquelquesremarques on ernant l'estimationdesmoindres

arrés onditionnelle des paramètres. Notons que, les propriétés du modèle GINAR(p)

ont été étudiées aussi par Da Silva et Oliveira (2005, 2006, [16 ℄, [17 ℄) et Da Silva et Da

Silva (2006, [15 ℄). De plus, Drost etal. (2008, [20 ℄) ont fourni un estimateur e a e des

paramètres, eten parti ulier, ont montré que le modèle GINAR(p) (et par onséquent le

pro essusINAR(p)-DL) possèdela propriétéde lanormalité asymptotiquelo ale(LAN).

1.2.5 Le modèle MGINAR(p)

Latour (1997, [46℄) a introduit le modèle MGINAR(p), pour analyser les séries

hro-nologiques à valeurs entières multivariées. Ce dernier est basé sur l'opérateur matri iel

généralisé deSteutel

&

Van Harn.

Dénition 1.2.4. (L'opérateurmatri iel d'amin issementgénéralisé, noté

A⋆

). Soit

A⋆ = {a

ij

⋆}

1≤i,j≤d

une matri e

d × d

d'opérateurs d'amin issementgénéralisés. Soit

Z

un ve teur devariables aléatoiresà valeurs entières positivesde dimension

d

. L'eet de

A⋆

sur

Z = (Z

1

, · · · , Z

d

)

τ

, noté

A ⋆ Z

, est déni par

A ⋆

Z

1

. . .

Z

d

=

P

d

j=1

a

1j

⋆ Z

j

. . .

P

d

j=1

a

dj

⋆ Z

j

.

I i,tous lesopérateurs

{a

ij

⋆}

(30)

Dénition 1.2.5. Soit

{X

t

}

t∈Z

, une suite de ve teurs de variables aléatoires à valeurs entières positives de dimension

d

;

p ∈ N

et

{A

j

⋆}

j∈{1,2,··· ,p}

, une suite d'opérateurs ma-tri iels mutuellement indépendantes;

t

}

t∈Z

, une suite de ve teurs de dimension

d

de variables aléatoires i.i.d.à valeurs entières positives;de arréintegrable;indépendantesde

tous les opérateurs. Alors

{X

t

}

t∈Z

est unpro essus MGINAR(p)si

X

t

=

p

X

j=1

A

j

⋆ X

t−j

+ ε

t

, ∀ t ∈ Z.

Latour (1997, [46℄) a donné les onditions de stationnarité et de ausalité d'un tel

pro essusetamontréquelafon tiond'auto ovarian eduMGINAR(p)estidentiqueà elle

dupro essusautorégressifve torielstandardàvaleursréelles,notéVAR(p).Ilendéduitque

lepro essusMGINAR(P)n'est autrequ'un pro essusVAR(p). Par onséquent, ladensité

spe traleest dire tement trouvée etdonne une bonneidée de lastru turesto hastique de

MGINAR(p). Par suite,l'auteur (1997, [46℄) a onsidérél'estimateur des moindres arrés

onditionnels pour estimer les paramètres du modèle et a montré la onsistan e et la

normalitéasymptotiquede l'estimateur.

1.3 Contributions de la thèse

Au ours de ette thèse, notre attention s'est portée uniquement sur les modèles

au-torégressifs à valeurs entières. Dans les paragraphes suivants, nous évoquons les limites

des modèles, basés sur les opérateurs d'amin issement, mentionnés pré édemment. Nous

présentonsune nouvelle lassedemodèles autorégressifsàvaleursentières,basés sur

l'opé-rateur d'arrondi à l'entier le plus près. Nous présentons les intérêts et les motivations

d'introduire ette dernière. Finalement, nousfournissons unplande notre travail.

1.3.1 Critiques des modèles basés sur les opérateurs d'amin issement

Les modèles autorégressifs àvaleurs entières basés sur les opérateurs d'amin issement

sourent deplusieurs handi aps.

 Leur stru ture d'innovation est omplexe, dépendant non seulement du bruit, mais

égalementdu hoixdessériesde omptage.Expli itement,nous onsidéronslemodèle

INAR(2)dénipar

(31)

0 ≤ a

1

< 1

,

0 < a

2

< 1

et

0 < a

1

+ a

2

< 1

.Nousrappelons que

a

1

◦ X

t−1

=

X

t−1

X

k=1

ξ

1k

et

a

2

◦ X

t−2

=

X

t−2

X

k=1

ξ

2k

,

où la série de omptage

1k

)

(resp.

2k

)

) est une suite de variables aléatoires in-dépendantes, identiquement distribuées selon une loi de Bernoulli de paramètre

a

1

(resp.

a

2

) et indépendante de

X

t−1

(resp.

X

t−2

). Ainsi, si

1k

)

et

2k

)

sont mu-tuellement indépendantes, alors le modèle INAR(2) possède la même stru ture de

orrélationqu'un AR(2)réel (voir Se tion 1.2.3).Par ontre, Sinoussupposons une

ertaine dépendan e entre les sériesde omptage lastru ture de orrélationdu

pro- essusINAR(2) devient identiqueà elled'unARMA(2,1)réel (voir Se tion 1.2.2).

 À ause de l'opérateur d'amin issement, es modèles ne peuvent pas produire des

auto orrélations négatives. Plus pré isément, nous onsidérons le modèle INAR(1)

dénipar

X

t

= a ◦ X

t−1

+ ε

t

, ∀ t ∈ Z.

Rappelonsque edernierpossèdelamêmestru turede orrélationqu'unAR(1)réel.

En parti ulier,

ρ(1) = a ∈ [0, 1[ .

Ainsi, si nousdisposons d'une série hronologique à valeurs entières ave

ρ(1) < 0

ˆ

, alors lemodèle INAR(1)n'est appropriépour analyser ettesérie.

 En général, leur prévisionà un pasbasée sur l'espéran e onditionnelle (la fon tion

derégression)estunevaleur réelle.Ainsi, ettedernièren'appartient pasausupport

entier desobservations de la série. À titre d'exemple, pour le pro essus GINAR(p)

(par onséquentpour lepro essusINAR(p)-DL)laprévision,àl'instant

T

,baséesur lafon tion de régressionestdonnéepar

ˆ

X

T

=

E[X

T

| F

T

−1

] =

p

X

j=1

a

j

X

T

−j

+ λ,

F

T

−1

= σ {X

T

−1

, · · · }

et

t

= λ

.

X

ˆ

T

n'est don enpratique jamaisentière.

1.3.2 Intérêts des modèles introduits

Laplupartdesmodèlesautorégressifsàvaleursentièresexistantsdanslalittératureont

(32)

des modèles autorégressifs à valeurs entières qui peuvent produire aussi des observations

négatives.

Pourquoi des modèles sur

Z

?

Une réponse naturelle et dire te est que les séries hronologiques à valeurs entières

ayant desobservations négativessont aussifréquentes danslapratique.Àtitred'exemple,

dans la Se tion 2.7 nous traitons la série des taux de variation annuels de la population

Suédoise entre

1750

et

1849

où lesobservations varient entre

−27

et

16

.

D'autre part, supposons que nous disposons d'une série hronologique à valeurs entières

positivesoùnousdéte tonsparexempledesu tuationssaisonnières.Pour éliminerla

sai-sonnalitédesobservations (etainsirendrelasériestationnaire)nousutilisonslate hnique

de diéren iation. Ainsi,noussommes amenés à étudierune série hronologiqueà valeurs

entièrespossédant desobservations négatives.

Par ailleurs,supposonsquenousdisposonsd'unesérie hronologiqueà valeursentières

po-sitivesassez élevées, noussouhaitons réduire les variations de esobservations touten en

gardant leur nature entière. En d'autres termes, en utilisant deste hniques similaires au

entragedansle asdesobservationsréelles,nousaboutissonsàdesobservationsentièresà

faiblesvariationsqui os illentautour de

0

.En oreune fois,noussommesamenés àtraiter une série hronologique àvaleursentièrespossédant desobservations négatives.

Le modèle RINAR

Pourgénérerdesobservationsàvaleursentières,nousenvisageonsl'opérateur d'arrondi

àl'entier leplusprès. Cedernierestsouvent utilisé pour ré olterdesobservations entières

àpartirdes donnéesréelles (parexemple, lesdonnées météorologique).

Ainsi, nousintroduisonslemodèlesuivant

X

t

= h

p

X

j=1

α

j

X

t−j

+ λi + ε

t

,

(1.28)

h·i

représente l'opérateur d'arrondiàl'entierleplusprès,

t

)

estune suitede variables aléatoiresi.i.d. entrées à valeursdans

Z

,

λ

etles

α

j

sontdes paramètres réels.

Cemodèle estappeléRINAR(p)(pour Rounded INteger-valued AutoRegessif).

Notons que l'opérateur d'arrondi peutêtre interprêté omme une fon tion de ensure sur

lemodèle AR(p)réel et

λ

omme lamoyenne du bruitnon- entré(

ε

(33)

Les avantages du modèle introduit

Comparéauxmodèlesautorégressifsàvaleursentièresbasés surlesopérateurs

d'amin- issement lemodèleRINARprésentequelques avantages.

 Sa stru tured'innovationest simple,générée uniquement parle bruit

t

)

.

 Par onstru tion RINAR(p)peutanalyser desséries hronologiques ave desvaleurs

négatives, une situation quin'est ouvertepar au un modèle INAR.

 Sa prévisionàun pas,basée surl'espéran e onditionnelle,est donnéepar

ˆ

X

T

=

E (X

T

| X

s

, s ≤ T − 1) = h

p

X

j=1

α

j

X

T

−j

+ λi.

Cettedernière estune valeurentièrepar onstru tion du modèle.

 NousverronségalementquelemodèleRINAR(p)peutproduiredesauto orrélations

aussiri hes que elles d'unAR(p)réel,y ompris lesauto orrélationsnégatives.

1.3.3 Plan de la thèse

L'introdu tiondenouvelles lassesdemodèlesautorégressifsàvaleursentièresprésente

l'objetdenosre her hesau oursde ettethèse.Dans ebut,nousnoussommesbaséssur

l'opérateur d'arrondi à l'entier le plus près qui nous semble assez intuitif etnaturel pour

générerdesobservationsàvaleursentières.Lesmodèlesproposésdans ettethèseexploitent

undomainerarement examiné:lamodélisationdesséries hronologiquesàvaleursentières

ayant des observations négatives. Par ailleurs, omparés aux modèles existants dans la

littérature esnouveauxmodèlespossèdentplusieursavantages.Ainsi,lathèseestorganisé

de lamanière suivante.

L'étude théoriquedu modèlearrondi autorégressif àvaleursentièresdu premierordre,

RINAR(1), fait l'objet du Chapitre 2 de ette thèse. Ainsi, après une présentation des

propriétés de l'opérateur d'arrondi à l'entier le plus près, nous introduisons le modèle

RINAR(1). Ensuite, nous donnons les onditions de stationnarité et d'ergodi ité de e

pro essus. Spé iquement, nous signalons que omme pour un pro essus AR(1) réel, la

valeurabsolue du oe ient derégressiondoitêtreinférieure stri tement à

1

.Par ailleurs, nous présentons quelques propriétés générales du modèle introduit. En parti ulier, nous

nousintéressonsaux al ulsdelamoyenneetdes oe ientsd'auto orrélationdupro essus

(34)

paramètres enfon tionde leursvaleurshomologuesdansle asd'unpro essusAR(1)réel.

D'autrepart,nousexaminonsleproblèmed'identiabilité,dûaussiàl'opérateurd'arrondi,

et la onsistan e forte de l'estimateur des moindres arrés proposé pour l'estimation des

paramètresdumodèle.Danslasuite,nousproposonsuneméthodenumériquepour al uler

e dernier. Finalement, nous analysons deux exemples de série hronologique à valeurs

entièresbien onnus, ave le pro essusRINAR(1).

LeChapitre3est onsa réàl'étudedumodèlearrondiautorégressifàvaleursentières

d'ordresupérieur,notéRINAR(p).Cedernierestuneextensionnaturelleetdire tedu

mo-dèleRINAR(1)étudier dansleChapitre 2.Enpremier lieu,nousimposonsdes onditions

pour assurer la stationnarité et l'ergodi ité du pro essus. Ensuite, nous proposons

l'esti-mateurdesmoindres arréspourestimer les paramètresdumodèleRINAR(p).Puis, nous

examinonsleproblème d'identiabilité, dûà l'opérateur d'arrondi, et la onsistan ede e

dernier.Parailleurs,nousproposonsuneméthodenumériquepour al ulerl'estimateurdes

moindres arrés.Cettedernièren'est autrequ'une généralisationdelaméthode numérique

onsidéréedansle Chapitre2.Pour en nir, nousprésentons uneappli ation réelletraitée

ave un modèle RINAR(p).

Dans le Chapitre 4 nous étudions le modèle RINVAR dédié à l'analyse des séries

hronologiques à valeurs entières multivariées. En parti ulier, nous nous on entrons sur

lemodèledupremier ordre,notéRINVAR(1).Premièrement,nousdonnonsles onditions

destationnarité etd'ergodi itédupro essus.Ensuite, nousexaminonsleproblème

d'iden-tiabilité, dûàl'opérateur d'arrondi, etla onsistan edel'estimateur desmoindres arrés

proposépourestimerlesparamètresdumodèle.D'autrepart,nousproposonsuneméthode

numérique pour al uler l'estimateur desmoindres arrés.Nous terminons le hapitre par

une appli ation réelletraitée ave un modèleRINVAR(1).

L'étude du modèle arrondi entré autorégressif à valeurs entières du premier ordre

fait l'objetdu Chapitre 5. Cedernier est appeléRINAR(1) entré et permet d'analyser

des séries hronologiques à valeurs entières dont les observations os illent autour de

0

(et ainsi de moyenne nulle). La stationnarité et l'ergodi ité de e modèle sont assurées

dans les mêmes onditions que elles pour le modèle RINAR(1). Le RINAR(1) entré ne

possède pasunproblèmed'identiabilité. Ainsi,l'estimateurdesmoindres arrés onsidéré

pour l'estimationduparamètredumodèleestfortement onsistant.Nousintroduisonsdes

(35)

RINAR(1). En parti ulier, nous n'arrivons pas à al uler expli itement es oe ients

d'auto orrélationmaisnouspouvonslesen adrer.Parailleurs,nousproposonsuneméthode

numérique pour al ulerl'estimateurdesmoindres arrés.Suiteàune étudedesimulation

qui ompare les oe ients d'auto orrélation du modèle RINAR(1) entré et eux d'un

AR(1) réel, nous distinguons deux omportements diérents dépendant de la nature du

bruit onsidéré(grandoupetit).Finalement,nous omparonslemodèleRINAR(1) entré

étudié dans e hapitre etlemodèle RINAR(1)re entré.

Dans le Chapitre 6, nous introduisons un pro essus autorégressif du premier ordre

basé sur l'opérateur d'arrondi pour analyser des séries hronologiques à valeurs entières

positives,notéPRINAR(1).Enpremierlieu,nousintroduisonsles onditionsquiassurentla

positivité,lastationnaritéetl'ergodi itéde emodèle.Parlasuite,nousdonnonslerésultat

prin ipal on ernant la onsistan e forte de l'estimateur des moindres arrés onsidéré

pour estimer les paramètres du modèle. Puis, nous étudions les propriétés générales du

modèle.Enparti ulier,noustrouvonsdesen adrementspoursamoyenne etses oe ients

d'auto orrélation.Suiteàuneétudedesimulation on ernant esdeniers,nousremarquons

beau oupdedétails urieuxdansle asoùbruitutiliséestpetit.Finalement,nousdonnons

les onditionsné essairespourquelaloistationnairedupro essusPRINAR(1)possèdeun

(36)

Le modèle RINAR(1)

Sommaire

2.1 Quelquesdénitions . . . 20

2.2 Stationnarité etergodi ité du pro essusRINAR(1). . . 24

2.3 Propriétés du pro essusRINAR(1) . . . 26

2.4 Estimationdes paramètres . . . 29

2.4.1 La onsistan efortedel'estimateurdesmoindres arrésquandle

oe ientderégression

α

0

est irrationnel . . . 34

2.4.2 La onsistan efortedel'estimateurdesmoindres arrésquandle

oe ientderégression

α

0

est rationnel . . . 43

2.5 Méthode numérique pour al uler

θ

ˆ

n

. . . 57

2.5.1 Initialisation . . . 58

2.5.2 Re her hedi hotomiquesu essive . . . 58

2.5.3 Étude desimulation . . . 61

2.6 Analyse des donnéesd'O'Donovan . . . 65

2.6.1 LemodèleAR(1) d'O'Donovan . . . 67

2.6.2 AjustementàunmodèleRINAR(1) . . . 69

2.6.3 Comparaisonet ommentaires. . . 71

2.7 Analysedestauxde variationannuelsdelapopulationSuédoise 71

2.7.1 AjustementàunmodèleAR(1) . . . 74

2.7.2 AjustementàunmodèleRINAR(1) . . . 74

2.7.3 L'appro hedeM Cleary

&

Hay. . . 76

(37)

Pour générerdesobservationsàvaleursentiéres nous onsidérons l'opérateur d'arrondi

à l'entier le plus près. Ce hapitre est onsa ré à l'étude théorique du modèle RINAR(1)

(pour roundedinteger-valuedautoregressive), basésur l'opérateur d'arrondi.

Dans le premier paragraphe nous présentons quelquespropriétés utiles de l'opérateur

d'arrondiàl'entierleplusprès. Dansledeuxièmeparagraphe,nousintroduisonslemodèle

RINAR(1),nousdonnons les onditions de stationnarité etd'ergodi ité dupro essus. Par

suite, dansletroisième paragraphe,nousprésentons quelquespropriétés généralesdu

mo-dèle. Enparti ulier,nousnousintéressonsaux al ulsdes oe ientsd'auto orrélationdu

pro essus RINAR(1) stationnaire. Dans lequatrième paragraphe, nousexaminons le

pro-blèmed'identiabilité,dûàl'opérateurd'arrondi,etla onsistan efortedel'estimateurdes

moindres arrés proposé pour l'estimation des paramètres du modèle. Dans le inquième

paragraphe,nousproposonsuneméthode numérique pour al uler e dernier.Finalement,

dans lesdeux derniers paragraphes, nous analysons deuxexemples de série hronologique

à valeursentières bien onnus, ave le pro essus RINAR(1).

2.1 Quelques dénitions

Nousintroduisonsdans e paragraphe diversesnotations, dénitions et propriétés qui

sont utiliséesdanslasuite de e hapitre.Tout d'abord,rappelons lesnotations lassiques

suivantes

N = {x ∈ Z : x ≥ 0} , N

= {x ∈ Z : x > 0}

et

Z

= {x ∈ Z : x ≤ 0} .

h·i

représente l'opérateurd'arrondi à l'entier leplusprès. Soit

a

unnombre réel. Notons quelavaleur

hai

est lairement dénie partout,saufsi

a = k +

1

2

,où

k ∈ Z

. Par onvention, nousprenonspout tout

k ∈ N

et

p ∈ Z

hk +

1

2

i = k + 1

et

hp −

1

2

i = p − 1

(voirFigure 2.1). (2.1)

(38)

-4

-3

-2

-1

0

1

2

3

4

-4

-3

-2

-1

0

1

2

3

4

b

b

b

b

b

b

b

b

b

b

b

b

b

1

2

3

2

5

2

7

2

1

2

3

2

5

2

7

2

Fig. 2.1 La fon tion arrondi

Soit

{a}

la partie fra tionnaire dunombre réel

a

,nousavonsdon

{a} ∈ [0, 1[

.

I i, nous onsidérons que la partie fra tionnaire d'un réel négatif est égale à elle de sa

valeurabsolue (voir Figure2.2), .à.d.

∀ a ∈ R, {a} = {−a} = {|a|} ,

par exemple

{1.23} = {−1.23} = 0.23.

(2.2)

-3

-2

-1

0

1

2

3

-3

-2

-1

0

1

2

3

b

b

b

b

b

b

b

(39)

La fon tion signe,notée

s

,est déniepar

s(a) =

1,

si

a ≥ 0,

−1,

si

a < 0.

(2.3)

Soit

[a]

la partie entière de

a ∈ R

,par exemple

[2.8] = 2

et

[−1.8] = −1

(voir Figure2.3). Il en résulte, pour tout

a ∈ R

,

a = [a] + s(a) {a} .

(2.4)

-3

-2

-1

0

1

2

3

-3

-2

-1

0

1

2

3

b

b

b

b

b

b

b

b

b

Fig. 2.3 La fon tionpartie entière

Ainsi,pour tout

a ∈ R

,nous trouvons

a = hai + s(a)



{a} − 11

{a}≥

1

2



.

(2.5)

Le lemme suivant rapportequelques propriétés générales. Cedernier est une onséquen e

(40)

Lemme 2.1.1. Soient

x ∈ R

,

k ∈ Z

et

a, b ≥ 0

. 1.

|hxi − [x] | = 11

{x}≥

1

2

.

2.

|hxi − x| ≤

1

2

.

3.

|hxi| = h|x|i ≤ |x| +

1

2

.

4.

hx + ki = k + hxi

.

5.

ha + bi = c + h{a} + {b}i

, où

c = hai + hbi − 11

{a}≥

1

2

− 11

{b}≥

1

2

. 6.

{a + b} = {{a} + {b}} =

{a} + {b} ,

si

{a} + {b} < 1,

{a} + {b} − 1,

si

{a} + {b} ≥ 1.

7.

hai = [a] + h{a}i.

8.

ha + bi = [a + b] + h{{a} + {b}}i =

[a + b] ,

si

0 ≤ {a} + {b} <

1

2

,

ou

1 ≤ {a} + {b} <

3

2

,

[a + b] + 1,

si

1

2

≤ {a} + {b} < 1,

ou

3

2

≤ {a} + {b} < 2.

9. Si

[a] = [b]

, alors

hai − hbi = h{a}i − h{b}i =

0,

si

{a} <

1

2

et

{b} <

1

2

,

ou

{a} ≥

1

2

et

{b} ≥

1

2

,

1,

si

{a} ≥

1

2

et

{b} <

1

2

,

−1,

si

{a} <

1

2

et

{b} ≥

1

2

.

10. Supposons

hai = hbi

et

{a} ∈



0,

1

2



. Nousdistinguons deux as :

 Si

[a] = [b]

,alors

{b} ∈



0,

1

2



.  Si

[a] = [b] + 1

, alors

{b} ∈

 1

2

, 1



.

11. Supposons que

hai = hbi

et

{a} ∈

 1

2

, 1



. Nous distinguonsdeux as :

 Si

[a] = [b]

,alors

{b} ∈

 1

2

, 1



.  Si

[a] = [b] − 1

, alors

{b} ∈



0,

1

2



.

Figure

Updating...

Références

Updating...

Sujets connexes :
Outline : Plan de la thèse