Voor 1970, ekonometrici en tydreeks ontleders gebruik aansienlik verskillende metodes om 'n tydreeksmodel. Ekonometrici geskoei tydreeks is 'n standaard lineêre regressie met verklarende veranderlikes deur ekonomiese teorie / intuïsie voorgestel om die bewegings in tydreeksdata te verduidelik. Hulle aanvaar dat die tyd reeks wat stationaire (groeiende oortyd) geen effek op hul empiriese ontleding het. Tydreeks ontleders aan die ander kant geïgnoreer hierdie tradisionele ekonometriese analise. Hulle geskoei 'n tydreeks as 'n funksie van sy verlede waardes. Hulle het rondom die probleem van nie-stationariteit deur breukmetodes die data om dit stilstaande maak. Dan, Clive Granger en Paul Newbold gebeur 1. Ekonometrici is gedwing om aandag te skenk aan die metodes van tydreekse ontleders, die mees bekende van wat was die BoxJenkins benader ontwikkel deur George P Box en Gwilym Jenkins en gepubliseer in hul legendariese monografie Tydreeksanalise : Vooruitskatting en beheer 2. Box en Jenkins beweer (suksesvol) wat nie-stationaire data stilstaande deur breukmetodes die reeks gemaak kan word. Hierdie reeks, Mathy / wiskunde is die insette in Box-Jenkins ontleding. Die algemene model vir Mathy / wiskunde word geskryf as, mathYphi1Y phi2Y. phipY epsilonttheta1epsilon theta2epsilon. thetaqepsilon / wiskunde waar mathphi / wiskunde en maththeta / wiskunde is onbekend parameters en mathepsilon / wiskunde is onafhanklike identies verdeelde fout terme met 'n nul gemiddelde. Hier is Mathy / wiskunde net uitgedruk in terme van sy verlede waardes en die huidige en vorige waardes van die dwaling terme. Hierdie model staan bekend as outoregressiewe geïntegreerde bewegende gemiddelde of mathARIMA (p, d, q) / wiskunde model van mathY. p / wiskunde is die aantal uitgestel waardes van Mathy / wiskunde wat die outoregressiewe (AR) aard van model, mathq / wiskunde verteenwoordig is die aantal uitgestel waardes van die foutterm wat die bewegende gemiddelde (MA) aard van model en mathd verteenwoordig / wiskunde is die aantal kere wat Mathy / wiskunde moet verskille aan die stilstaande Mathy / wiskunde te produseer. Die term geïntegreerde impliseer dat ten einde 'n voorspelling van Mathy / wiskunde behaal. ons het om op te som (of integreer oor) die waardes van Mathy / wiskunde omdat Mathy / wiskunde is die differenced waardes van die oorspronklike reeks Mathy. / Wiskunde Indien geen breukmetodes betrokke is, is hierdie model 'n outoregressiewe genoem bewegende gemiddelde mathARMA (p, q) / wiskunde met mathp / wiskunde en mathq / wiskunde behoud van hul oorspronklike betekenis en geen mathd. / Wiskunde Die term mathARIMA / wiskunde of mathARMA / wiskunde is baie verwarrend omdat beide, die mathAR / wiskunde en mathMA / wiskunde komponente dieselfde wiskundige vorm. Hulle is albei lineêre kombinasies van hede en verlede waardes van ewekansige veranderlikes. Die mathAR / wiskunde-komponent is die lineêre kombinasie van waarneembare waardes van Mathy / wiskunde, terwyl die mathMA / wiskunde-komponent is die lineêre kombinasie van die onwaarneembare wit geraas versteuring terme. Dit is net een van daardie onbenullighede wat jy gebruik het sou kry om met verloop van tyd. Ekonometrici geïgnoreer the Box-Jenkins benadering op die eerste, maar is gedwing om aandag te skenk aan hulle wanneer dit mathARIMA / wiskunde voorspellings begin konsekwent beter as voorspellings gebaseer op standaard ekonometriese modellering. Die gebrek aan gesonde ekonomiese teorie agter die mathARIMA / wiskunde was iewers vir ekonometrici te aanvaar. Hulle het gereageer deur die ontwikkeling van 'n ander klas van modelle wat auroregressive en bewegende gemiddelde komponente van Box-Jenkins benadering met die verklarende veranderlikes benadering van standaard ekonometrie opgeneem. Die eenvoudigste van sulke modelle is die mathARIMAX / wiskunde wat net 'n mathARIMA / wiskunde met bykomende verklarende veranderlikes wat deur ekonomiese teorie. 'N Standaard mathARIMAX / wiskunde sou geskryf word as, mathYbeta. X phi1Y phi2Y. phipY epsilonttheta1epsilon theta2epsilon. thetaqepsilon / wiskunde waar mathX / wiskunde enige ekonomiese veranderlike kan wees. 3k Views middot View upvotes middot Nie vir Reproduksie Het jy 'n blik op hierdie skakel: 8 ARIMA modelle OTexts Dit is die hoofstuk gewy aan ARIMA modelle van 'n fantastiese gratis aanlyn handboek oor tydreeks vooruitskatting van Rob J Hyndman P einde van die outoregressiewe deel . Dit is die aantal onbekende terme wat jou sein vermenigvuldig op verlede keer (soveel verlede keer as jou waarde p) D mate van eerste breukmetodes betrokke. Aantal kere wat jy hoef te verskil jou tyd-reeks 'n stilstaande een Q einde van die bewegende gemiddelde deel te hê. Dit is die aantal onbekende terme wat jou voorspelling foute vermeerder op die verlede (soveel verlede keer as jou waarde q) Daar is 'n goeie tegnieke om al hierdie parameters te beraam (gebaseer op die outokorrelasie - ACF - en gedeeltelike outokorrelasiefunksies - PACF): people. duke. edu/ en die proses kan komplekse en tydrowend wees, selfs meer as jy het baie tyd reeks te hanteer met. In R is daar 'n funksie genoem auto. arima in die vooruitsig pakket wat al hierdie parameters outomaties te evalueer, selfs die seisoen deel (bykomende waardes te bereken in die geval is daar is seisoenaliteit in jou tydreekse). 1.8k Views middot View upvotes middot Nie vir ReproductionA Rima staan vir outoregressiewe geïntegreerde bewegende gemiddelde modelle. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n science. Autoregressive bewegende gemiddelde Fout prosesse 13 13 13 13 13 13 outoregressiewe bewegende gemiddelde fout prosesse (ARMA foute) en ander modelle wat lags van die dwaling terme kan geskat word deur gebruik te maak FIT state en gesimuleerde of voorspel met behulp LOS state. ARMA modelle vir die fout proses word dikwels gebruik vir modelle met autocorrelated residue. Die AR makro kan gebruik word om modelle met outoregressiewe fout prosesse spesifiseer. Die MA makro kan gebruik word om modelle spesifiseer met bewegende gemiddelde fout prosesse. Outoregressiewe Foute 'n model met die eerste-orde outoregressiewe foute, AR (1), het die vorm terwyl 'n AR (2) fout proses het die vorm en dies meer vir hoër-orde prosesse. Let daarop dat die e onafhanklik en identies verdeelde en het 'n verwagte waarde van 0. 'n Voorbeeld van 'n model met 'n AR (2) komponent is Jy sal hierdie model te skryf soos volg: Of anders gestel met behulp van die AR makro as bewegende gemiddelde modelle 13 A model met die eerste-orde bewegende gemiddelde foute, MA (1), het die vorm waar is identies en onafhanklik versprei met gemiddelde nul. 'N MA (2) fout proses het die vorm en dies meer vir hoër-orde prosesse. Byvoorbeeld, kan jy 'n eenvoudige lineêre regressiemodel met MA (2) bewegende gemiddelde foute as waar Ma1 en Ma2 is die bewegende gemiddelde parameters skryf. Let daarop dat RESID. Y outomaties word gedefinieer deur PROC model Let daarop dat RESID. Y is. Die ZLAG funksie moet gebruik word vir MA modelle om die rekursie van die lags afgestomp. Dit verseker dat die vertraagde foute begin by nul in die lag priming fase en nie voort ontbrekende waardes wanneer-lag priming tydperk veranderlikes ontbreek, en verseker dat die toekomstige foute is nul eerder as vermis tydens simulasie of vooruitskatting. Vir meer inligting oor die lag funksies, sien die artikel 34Lag Logic.34 Hierdie model geskryf met behulp van die MA makro is Algemene Form vir ARMA Models Die algemene ARMA (p, q) proses het die volgende vorm 'n ARMA (p, q) model kan wees gespesifiseerde soos volg waar AR Ek en MA j verteenwoordig die outoregressiewe en bewegende gemiddelde parameters vir die verskillende lags. Jy kan enige name wat jy wil vir hierdie veranderlikes gebruik, en daar is baie soortgelyk maniere wat die spesifikasie kan geskryf word. Vektor ARMA prosesse kan ook beraam met PROC model. Byvoorbeeld, kan 'n twee-veranderlike AR (1) proses vir die foute van die twee endogene veranderlikes Y1 en Y2 soos volg Konvergensie Probleme met ARMA Models ARMA modelle kan moeilik om te skat wees gespesifiseer word. As die parameter ramings is nie binne die toepaslike omvang, 'n bewegende gemiddelde modelle oorblywende terme sal eksponensieel groei. Die berekende residue vir latere waarnemings kan baie groot wees of kan oorloop. Dit kan gebeur óf omdat onbehoorlike beginspan waardes is gebruik of omdat die iterasies wegbeweeg van redelike waardes. Sorg moet gedra word in die keuse van beginspan waardes vir ARMA parameters. Begin waardes van 0,001 vir ARMA parameters gewoonlik werk as die model pas die data goed en die probleem is goed gekondisioneer. Let daarop dat 'n MA-model dikwels benader kan word deur 'n hoë orde AR model, en omgekeerd. Dit kan lei tot 'n hoë collinearity in gemengde ARMA modelle, wat op sy beurt ernstige swak kondisionering in die berekeninge en onstabiliteit van die parameter ramings kan veroorsaak. As jy konvergensie probleme te hê, terwyl die skatte van 'n model met ARMA foute prosesse, probeer om te skat in stappe. In die eerste plek gebruik 'n geskikte verklaring aan net die strukturele parameters met die ARMA parameters gehou na nul (of om vooraf redelike raming indien beskikbaar) te skat. Volgende, gebruik 'n ander FIT verklaring slegs die ARMA parameters beraam, met behulp van die strukturele parameterwaardes van die eerste termyn. Sedert die waardes van die strukturele parameters is waarskynlik naby aan hul finale skattings te wees, kan die ARMA parameterberaming nou bymekaar. Ten slotte, gebruik 'n ander FIT verklaring aan gelyktydige skattings van al die parameters te produseer. Sedert die aanvanklike waardes van die parameters is nou waarskynlik baie naby aan hul finale gesamentlike skattings te wees, moet die skattings vinnig bymekaar as die model geskik is vir die data is. AR beginvoorwaardes 13 13 13 13 13 13 13 13 13 13 Die aanvanklike lags van die fout terme van AR (p) modelle gemodelleer kan word in verskillende maniere. Die outoregressiewe fout begin metodes deur SAS / ETS prosedures is die volgende: CLS voorwaardelike kleinste kwadrate (ARIMA en model prosedures) ULS onvoorwaardelike kleinste kwadrate (AUTOREG, ARIMA, en model prosedures) ML maksimum waarskynlikheid (AUTOREG, ARIMA, en model prosedures) YW Yule-Walker (AUTOREG prosedure net) HL Hildreth-Lu, wat (enigste model prosedure) die eerste p Waarnemings verwyder Sien Hoofstuk 8. vir 'n verduideliking en bespreking van die meriete van verskeie AR (p) begin metodes. Die CLS, ULS, ML, en HT initializations uitgevoer kan word deur PROC model. Vir AR (1) foute, kan hierdie initializations geproduseer, soos uiteengesit in Tabel 14.2. Hierdie metodes is ekwivalent in groot monsters. Tabel 14.2: Initializations Uitgevoer deur PROC Model: AR (1) FOUTE MA beginvoorwaardes 13 13 13 13 13 13 Die aanvanklike lags van die fout terme van MA (Q) modelle kan ook geskoei op verskillende maniere. Die volgende bewegende gemiddelde fout begin paradigmas word ondersteun deur die ARIMA en model prosedures: ULS onvoorwaardelike kleinstekwadrate CLS voorwaardelike kleinstekwadrate ML maksimum waarskynlikheid die voorwaardelike kleinste-kwadrate metode van beraming bewegende gemiddelde fout terme is nie optimaal omdat dit ignoreer die begin probleem. Dit verminder die doeltreffendheid van die skat, hoewel hulle onbevooroordeelde bly. Die aanvanklike uitgestel residue, die uitbreiding van voor die aanvang van die data, is veronderstel om 0, hul onvoorwaardelike verwagte waarde. Dit stel 'n verskil tussen hierdie residue en die algemene kleinste-kwadrate residue vir die bewegende gemiddelde kovariansie, wat, in teenstelling met die outoregressiewe model, voortduur deur die datastel. Gewoonlik hierdie verskil konvergeer vinnig tot 0, maar vir byna noninvertible bewegende gemiddelde prosesse die konvergensie is baie stadig. Om hierdie probleem te verminder, moet jy baie data het, en die bewegende gemiddelde parameterberaming moet goed binne die omkeerbare reeks. Hierdie probleem reggestel kan word ten koste van die skryf van 'n meer komplekse program. Onvoorwaardelike kleinste-kwadrate beramings vir die MA (1) proses kan geproduseer word deur die spesifiseer van die model soos volg: Moving-gemiddelde foute kan moeilik om te skat wees. Jy moet oorweeg om 'n AR (p) benadering tot die bewegende gemiddelde proses. 'N bewegende gemiddelde proses kan gewoonlik goed benader word deur 'n outoregressiewe proses as die data is nie stryk of differenced. Die AR Makro Die SAS makro AR genereer programmering state vir PROC model vir outoregressiemodelle. Die AR makro is deel van SAS / ETS sagteware en geen spesiale opsies moet ingestel word om die makro gebruik. Die outoregressiewe proses toegepas kan word om die strukturele vergelyking foute of om die endogene reeks hulself. Die AR makro kan gebruik word vir eenveranderlike-motor regressie onbeperkte vector-motor regressie beperk vector-motor regressie. Eenveranderlike motor regressie 13 Om die foutterm van 'n vergelyking model as 'n outoregressiewe proses, gebruik die volgende stelling na die vergelyking: Byvoorbeeld, veronderstel dat Y is 'n lineêre funksie van X1 en X2, en 'n AR (2) fout. Die oproepe na AR moet kom na al die vergelykings wat die proses van toepassing op: Jy sal hierdie model soos volg skryf. Die proceding makro aanroeping, AR (y, 2), produseer die state getoon in die lys uitset in Figuur 14.49. Figuur 14.50: LYS Opsie Uitset vir 'n AR Model met lags op 1, 12, en 13 Daar is variasies op die voorwaardelike kleinste-kwadrate metode, afhangende van of waarnemings op die begin van die reeks word gebruik om 34warm up34 die AR proses. By verstek, die AR voorwaardelike kleinste-kwadrate metode gebruik al die waarnemings en aanvaar nulle vir die aanvanklike lags van outoregressiewe terme. Deur die gebruik van die opsie man, kan jy versoek dat AR gebruik die onvoorwaardelike kleinste-kwadrate (ULS) of metode maksimum-waarskynlikheid (ML) plaas. Byvoorbeeld: Besprekings van hierdie metodes word in die 34AR Aanvanklike Conditions34 vroeër in hierdie afdeling. Deur die gebruik van die MCLS N opsie, kan jy versoek dat die eerste N Waarnemings word om skattings van die aanvanklike outoregressiewe lags bereken. In hierdie geval, die ontleding begin met waarneming N 1. Byvoorbeeld: Jy kan die AR makro gebruik om 'n outoregressiewe model toe te pas om die endogene veranderlike, in plaas van om die foutterm, deur gebruik te maak van die opsie TYPEV. Byvoorbeeld, as jy wil die vyf afgelope lags van Y toe te voeg tot die vergelyking in die vorige voorbeeld, jy kan AR gebruik om die parameters te genereer en lags met behulp van die volgende stellings: Die voorafgaande stellings te genereer die uitset in Figuur 14.51. Die model Prosedure aanbieding van Saamgestel Verklaring programkode as Geperste PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y) yl2 ZLAG2 (y ) yl3 ZLAG3 (y) yl4 ZLAG4 (y) yl5 ZLAG5 (y) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Figure 14.51: LYS Opsie Uitset vir 'n AR model van y Hierdie model voorspel y as 'n lineêre kombinasie van X1, X2, 'n onderskep, en die waardes van Y in die mees onlangse vyf periodes. Onbeperkte vector-motor regressie 13 Om die fout terme van 'n stel vergelykings as 'n vektor outoregressiewe proses te modelleer, gebruik die volgende vorm van die AR makro na die vergelykings: Die processname waarde is 'n naam wat jy verskaf vir AR om te gebruik in die maak van name vir die outoregressiewe parameters. Jy kan die AR makro gebruik om verskillende AR prosesse vir verskillende stelle vergelykings model deur gebruik te maak van verskillende proses name vir elke stel. Die naam proses verseker dat die veranderlike name wat uniek is. Gebruik 'n kort processname waarde vir die proses as parameter ramings geskryf moet word om 'n uitset datastel. Die AR makro probeer parameter name minder as of gelyk aan agt karakters bou, maar dit is beperk deur die lengte van naam. wat gebruik word as 'n voorvoegsel vir die AR parameter name. Die variablelist waarde is die lys van endogene veranderlikes vir die vergelykings. Byvoorbeeld, veronderstel dat foute vir vergelykings Y1, Y2, en Y3 gegenereer deur 'n tweede-orde vektor outoregressiewe proses. wat die volgende vir Y1 en soortgelyke kode vir Y2 en Y3 genereer: Slegs die voorwaardelike kleinste-kwadrate (MCLS of MCLS n) metode kan gebruik word vir vektor prosesse Jy kan die volgende stellings gebruik. Jy kan ook dieselfde vorm met beperkings wat die koëffisiëntmatriks 0 by uitgesoekte lags gebruik. Byvoorbeeld, die state van toepassing 'n derde-orde vektor proses om die vergelyking foute met al die koëffisiënte op lag 2 beperk tot 0 en met die koëffisiënte op lags 1 en 3 onbeperkte. Jy kan die drie reekse Y1-Y3 as 'n vektor outoregressiewe proses model in die veranderlikes in plaas van in die foute deur die gebruik van die opsie TYPEV. As jy wil 'n model Y1-Y3 as 'n funksie van die verlede waardes van Y1-Y3 en 'n paar eksogene veranderlikes of konstantes, kan jy AR gebruik om die state vir die lag terme te genereer. Skryf 'n vergelyking vir elke veranderlike vir die nonautoregressive deel van die model, en dan bel AR met die opsie TYPEV. Byvoorbeeld, kan die nonautoregressive deel van die model 'n funksie van eksogene veranderlikes wees, of dit kan onderskep parameters wees. As daar geen eksterne komponente om die vector-motor regressie model, insluitende geen afsnitte, dan wys nul tot elk van die veranderlikes. Daar moet 'n opdrag aan elkeen van die veranderlikes voor AR genoem. Hierdie voorbeeld modelle die vektor Y (Y1 Y2 Y3) as 'n lineêre funksie net van sy waarde in die vorige twee periodes en 'n wit geraas fout vektor. Die model het 18 (3 keer 3 3 keer 3) parameters. Sintaksis van die AR Makro Daar is twee gevalle van die sintaksis van die AR makro. Die eerste het die algemene vorm naam spesifiseer 'n voorvoegsel vir AR om te gebruik in die bou van name van veranderlikes wat nodig is om die AR proses te definieer. As die endolist nie gespesifiseer word nie, die endogene lys standaard te noem. wat moet die naam van die vergelyking waarna die AR fout proses toegepas moet word nie. Die naam mag nie meer as agt karakters. nlag is aan die orde van die AR proses. endolist spesifiseer die lys van vergelykings waarna die AR proses toegepas moet word. Indien meer as een naam word gegee, is 'n onbeperkte vektor proses geskep met die strukturele residue van al die vergelykings ingesluit as voorspellers in elk van die vergelykings. As nie gespesifiseer, verstek na endolist naam. laglist spesifiseer die lys van sloerings waarteen die AR terme is om by te voeg. Die koëffisiënte van die terme op lags nie gelys is ingestel op 0. Al die genoteerde lags moet minder as of gelyk aan nlag wees. en daar was geen duplikate moet wees. As nie gespesifiseer, die laglist standaard vir alle lags 1 deur nlag. M metode spesifiseer die skatting metode om te implementeer. Geldige waardes van M is CLS (voorwaardelike kleinste-kwadrate beramings), ULS (onvoorwaardelike kleinste-kwadrate beramings), en ML (maksimum-waarskynlikheid ramings). MCLS is die standaard. Slegs MCLS toegelaat wanneer meer as een vergelyking gespesifiseer. Die ULS en ML metodes word nie ondersteun nie vir vektor AR modelle deur AR. TYPEV bepaal dat die AR proses is self toegepas moet word om die endogene veranderlikes in plaas van om die strukturele residue van die vergelykings. Beperk vector-motor regressie 13 13 13 13 Jy kan beheer wat parameters ingesluit in die proses, die beperking van die parameters wat jy nie sluit aan 0. In die eerste plek gebruik AR met die opsie eerbiedig die veranderlike lys verklaar en die dimensie van die proses te definieer. Dan gebruik addisionele AR oproepe na terme vir geselekteerde vergelykings met geselekteerde veranderlikes by sekere lags genereer. Byvoorbeeld, die fout vergelykings geproduseer is Hierdie model stel dat die foute vir Y1 afhang van die foute van beide Y1 en Y2 (maar nie Y3) by beide lags 1 en 2, en dat die foute vir Y2 en Y3 afhang van die vorige foute vir al drie veranderlikes, maar slegs op lag 1. AR Makro Sintaksis vir Beperkte vector AR 'n alternatiewe gebruik van AR toegelaat word om beperkings op 'n vektor AR proses te lê deur AR 'n paar keer 'n beroep op verskillende AR terme spesifiseer en loop vir verskillende vergelykings. Die eerste oproep het die algemene vorm naam spesifiseer 'n voorvoegsel vir AR om te gebruik in die bou van name van veranderlikes wat nodig is om die vektor AR proses te definieer. nlag spesifiseer die einde van die AR proses. endolist spesifiseer die lys van vergelykings waarna die AR proses toegepas moet word. DEFER bepaal dat AR is nie om die AR proses te genereer, maar is om te wag vir verdere inligting wat in later AR oproepe vir die gelyknamige waarde. Die daaropvolgende oproepe het die algemene vorm naam is dieselfde as in die eerste oproep. eqlist spesifiseer die lys van vergelykings waarna die spesifikasies in hierdie AR oproep is wat toegepas moet word. Slegs name wat in die endolist waarde van die eerste oproep vir die naam waarde kan verskyn in die lys van vergelykings in eqlist. varlist spesifiseer die lys van vergelykings wie uitgestel strukturele residue is om ingesluit te word as voorspellers in die vergelykings in eqlist. Slegs name in die endolist van die eerste oproep vir die naam waarde kan verskyn in varlist. As nie gespesifiseer, verstek na varlist endolist. laglist spesifiseer die lys van sloerings waarteen die AR terme is om by te voeg. Die koëffisiënte van die terme op lags nie gelys is ingestel op 0. Al die genoteerde lags moet minder as of gelyk aan die waarde van nlag wees. en daar was geen duplikate moet wees. As nie gespesifiseer, verstek laglist al lags 1 deur nlag. Die MA Makro 13 Die SAS makro MA genereer programmering state vir PROC model vir bewegende gemiddelde modelle. Die MA makro is deel van SAS / ETS sagteware en geen spesiale opsies is nodig om die makro gebruik. Die bewegende gemiddelde fout proses toegepas kan word om die strukturele vergelyking foute. Die sintaksis van die MA makro is dieselfde as die AR makro behalwe daar is geen argument plekke. 13 Wanneer jy die MA en AR makros gekombineer, moet die MA makro die AR makro volg. Die volgende SAS / IML state te produseer 'n ARMA (1, (1 3)) fout proses en stoor dit in die datastel MADAT2. Die volgende PROC MODEL state word gebruik om die parameters van hierdie model gebruik te maak van maksimum waarskynlikheid fout struktuur skat: Die skat van die parameters wat deur hierdie lopie word in Figuur 14.52. Maksimum waarskynlikheid ARMA (1, (1 3)) Figuur 14.52: Beramings van 'n ARMA (1, (1 3)) Proses Sintaksis van die MA Makro Daar is twee gevalle van die sintaksis vir die MA makro. Die eerste het die algemene vorm naam spesifiseer 'n voorvoegsel vir MA om te gebruik in die bou van name van veranderlikes wat nodig is om die MA proses te definieer en is die standaard endolist. nlag is aan die orde van die MA-proses. endolist spesifiseer die vergelykings waarna die MA proses toegepas moet word. Indien meer as een naam word gegee, is CLS skatting gebruik vir die vektor proses. laglist spesifiseer die lags waarteen die MA terme is om by te voeg. Al die genoteerde lags moet minder as of gelyk aan nlag wees. en daar was geen duplikate moet wees. As nie gespesifiseer, die laglist standaard vir alle lags 1 deur nlag. M metode spesifiseer die skatting metode om te implementeer. Geldige waardes van M is CLS (voorwaardelike kleinste-kwadrate beramings), ULS (onvoorwaardelike kleinste-kwadrate beramings), en ML (maksimum-waarskynlikheid ramings). MCLS is die standaard. Slegs MCLS toegelaat wanneer meer as een vergelyking gespesifiseer op die endolist. MA Makro Sintaksis vir Beperkte Vector bewegende gemiddelde 13 'n Alternatiewe gebruik van MA toegelaat word om beperkings op 'n vektor MA proses te lê deur 'n paar keer 'n beroep MA verskillende MA terme spesifiseer en loop vir verskillende vergelykings. Die eerste oproep het die algemene vorm naam spesifiseer 'n voorvoegsel vir MA om te gebruik in die bou van name van veranderlikes wat nodig is om die vektor MA proses te definieer. nlag spesifiseer die einde van die MA-proses. endolist spesifiseer die lys van vergelykings waarna die MA proses toegepas moet word. DEFER bepaal dat MA is nie tot die MA proses te genereer, maar is om te wag vir verdere inligting wat in later MA oproepe vir die gelyknamige waarde. Die daaropvolgende oproepe het die algemene vorm naam is dieselfde as in die eerste oproep. eqlist spesifiseer die lys van vergelykings waarna die spesifikasies in hierdie MA oproep is wat toegepas moet word. varlist spesifiseer die lys van vergelykings wie uitgestel strukturele residue is om ingesluit te word as voorspellers in die vergelykings in eqlist. laglist spesifiseer die lys van sloerings waarteen die MA terme moet word added. Autoregressive bewegende gemiddelde ARMA (p, q) Modelle vir Tydreeksanalise - Deel 1 Deur Michael Saal-Moore op 17 Augustus 2015 In die laaste artikel het ons gekyk na ewekansige vlakke en wit geraas as 'n basiese tydreeksmodelle vir sekere finansiële instrumente, soos daaglikse gelykheid en regverdigheid indeks pryse. Ons het gevind dat in sommige gevalle 'n ewekansige loop model onvoldoende is om die volle outokorrelasie gedrag van die instrument, wat meer gesofistikeerde modelle motiveer vang was. In die volgende paar artikels gaan ons drie tipes model, naamlik die outoregressiewe (AR) model van orde p bespreek, die bewegende gemiddelde (MA) model van orde q en die gemengde Autogressive bewegende gemiddelde (ARMA) model van orde p , q. Hierdie modelle sal ons help om te probeer om op te vang of meer van die reeks korrelasie teenwoordig te verduidelik in 'n instrument. Uiteindelik sal hulle ons te voorsien met 'n manier om te voorspel die toekoms pryse. Dit is egter bekend dat finansiële tydreekse beskik oor 'n eiendom bekend as wisselvalligheid groepering. Dit wil sê, die wisselvalligheid van die instrument is nie konstant in tyd. Die tegniese term vir hierdie gedrag is bekend as voorwaardelike heteroskedasticity. Sedert die AR, MA en ARMA modelle is nie voorwaardelik heteroskedastic, dit is, hulle dit nie in ag neem wisselvalligheid groepering, sal ons uiteindelik moet 'n meer gesofistikeerde model vir ons voorspellings. Sulke modelle sluit in die Autogressive Voorwaardelike Heteroskedastic (Arch) model en algemene Autogressive Voorwaardelike Heteroskedastic (GARCH) model, en die vele variante daarvan. GARCH is veral bekend in Quant finansies en is hoofsaaklik gebruik word vir finansiële tydreekse simulasies as 'n middel van die beraming van die risiko. Maar soos met alle QuantStart artikels, ek wil op te bou tot hierdie modelle uit eenvoudiger weergawes, sodat ons kan sien hoe elke nuwe variant verander ons voorspellende vermoë. Ten spyte van die feit dat AR, MA en ARMA is relatief eenvoudig tydreeksmodelle, hulle is die basis van meer ingewikkeld modelle soos die outoregressiewe geïntegreerde bewegende gemiddelde (ARIMA) en die GARCH familie. Daarom is dit belangrik dat ons dit bestudeer. Een van ons eerste handel strategieë in die tydreeks artikel reeks sal wees om ARIMA en GARCH kombineer ten einde pryse N tydperke voorspel vooruit. Ons sal egter moet wag tot weve beide ARIMA en GARCH bespreek afsonderlik voordat ons toe te pas op 'n ware strategie Hoe sal ons voortgaan In hierdie artikel gaan ons 'n paar nuwe tydreekse konsepte wat goed nodig vir die res van die metodes uiteen, naamlik streng stasionariteit en die Akaike inligting maatstaf (AIC). Na afloop van hierdie nuwe konsepte sal ons die tradisionele patroon vir die bestudering van nuwe tydreeksmodelle volg: Rasionaal - Die eerste taak is om 'n rede waarom belangstel in 'n bepaalde model was, as kwantitatiewe voorsien. Hoekom is ons die bekendstelling van die tydreeksmodel Watter gevolge kan dit vang Wat doen ons kry (of verloor) deur die byvoeging van ekstra kompleksiteit Definisie - Ons moet die volle wiskundige definisie (en gepaardgaande notasie) van die tydreeksmodel te voorsien ten einde te verminder enige dubbelsinnigheid. Tweede Orde Properties - Ons sal bespreek (en in sommige gevalle lei) die tweede orde eienskappe van die tydreeksmodel, wat sy gemiddelde, sy stryd en sy outokorrelasie funksie sluit. Correlogram - Ons sal die tweede orde eienskappe te gebruik om 'n correlogram van 'n besef van die tydreeksmodel plot ten einde sy gedrag te visualiseer. Simulasie - Ons sal simuleer realisasies van die tydreeksmodel en dan pas die model om hierdie simulasies te verseker ons het akkurate implementering en verstaan die gepaste proses. Real finansiële inligting - Ons sal pas by die tydreeksmodel werklike finansiële data en kyk na die correlogram van die residue om te sien hoe die model is verantwoordelik vir korrelasie in die oorspronklike reeks. Voorspelling - Ons sal N-stap vorentoe te skep voorspellings van die tydreeks model vir bepaalde realisasies om uiteindelik te produseer handel seine. Byna al die artikels wat ek skryf oor tydreeksmodelle sal val in hierdie patroon en dit sal ons in staat stel om die verskille tussen elke model maklik vergelyk soos ons verder kompleksiteit te voeg. Op pad was om te begin deur te kyk na 'n streng stasionariteit en die AIC. Streng Skryfbehoeftes Ons verskaf die definisie van stasionariteit in die artikel oor korrelasie. Maar omdat ons gaan betree die gebied van baie finansiële reeks, met verskillende frekwensies, moet ons seker maak dat ons (uiteindelike) modelle in ag neem die tyd wat wissel wisselvalligheid van hierdie reeks. In die besonder, moet ons hul heteroskedasticity oorweeg. Ons sal teëkom hierdie kwessie wanneer ons probeer om sekere modelle te pas om historiese reeks. Oor die algemeen, kan nie al die korrelasie in die residue van toegeruste modelle in berekening gebring word sonder om heteroskedasticity in ag neem. Dit bring ons terug na stasionariteit. 'N Reeks is nie stilstaande in die stryd as dit tyd wisselende wisselvalligheid, per definisie. Dit motiveer 'n grondigere definisie van stasionariteit, naamlik streng stasionariteit: Streng Skryfbehoeftes Series A tydreeksmodel, is streng stilstaande as die gesamentlike statistiese verspreiding van die elemente X, ldots, x is dieselfde as dié van XM, ldots, XM, forall ti, m. 'N Mens kan dink aan hierdie definisie as net dat die verspreiding van die tydreeks is onveranderd vir enige abritrary verskuiwing in die tyd. In die besonder, die gemiddelde en variansie is konstant in die tyd vir 'n streng stilstaande reeks en die outokovariansiefunksie tussen xt en XS (sê) hang net af van die absolute verskil van t en s, t-s. Ons sal weer na streng stilstaande reeks in die toekoms poste. Akaike Inligting Criterion ek reeds in vorige artikels wat ons uiteindelik sal moet kyk hoe om te kies tussen afsonderlike beste modelle. Dit is waar nie net van tydreeksanalise, maar ook van die masjien leer en, meer in die algemeen, statistieke in die algemeen. Die twee belangrikste metodes wat ons sal gebruik (vir die oomblik) is die Akaike Inligting Criterion (AIC) en die Bayesiaanse Inligting Criterion (soos ons vorder verder met ons artikels oor Bayes Statistiek). Wel kortliks kyk na die AIC, want dit sal gebruik word in Deel 2 van die ARMA artikel. AIC is in wese 'n instrument om te help met model seleksie. Dit wil sê, as ons 'n keuse van statistiese modelle (insluitend tydreekse), dan beraam die AIC die gehalte van elke model, in vergelyking met die ander wat ons beskikbaar het. Dit is gebaseer op inligting teorie. Dit is 'n hoogs interessante, diep onderwerp wat ongelukkig kan nie ons in te veel detail oor te gaan. Dit poog om die kompleksiteit van die model, wat in hierdie geval beteken die aantal parameters, met hoe goed dit pas by die data te balanseer. Kom ons 'n definisie: Akaike Inligting Criterion As ons die waarskynlikheid funksie vir 'n statistiese model wat k parameters het, en L maksimeer die waarskynlikheid. dan die Akaike Inligting Criterion word gegee deur: Die voorkeur model, uit 'n seleksie van modelle, het die menie AIC van die groep. Jy kan sien dat die AIC groei as die aantal parameters, k, toeneem, maar verminder indien die negatiewe log-waarskynlikheid toeneem. In wese is dit penaliseer modelle wat overfit is. Ons gaan skep AR, MA en ARMA modelle van verskillende bestellings en een manier om uit te kies die beste model pas 'n spesifieke datastel is om die AIC gebruik. Dit is wat goed doen in die volgende artikel, in die eerste plek vir ARMA modelle. Outoregressiewe (AR) Models van orde p Die eerste model is van plan om te oorweeg, wat die basis van Deel 1 vorm, is die outoregressiewe model van orde p, dikwels verkort tot AR (p). Rasionaal In die vorige artikel beskou ons die ewekansige loop. waar elke term, xt is afhanklik uitsluitlik op die vorige kwartaal, x en 'n stogastiese wit geraas termyn, wel met: Die outoregressiewe model is eenvoudig 'n uitbreiding van die ewekansige loop wat kragtens verder terug in die tyd insluit. Die struktuur van die model is lineêr. dit is die model hang lineêr op die vorige terme, met koëffisiënte vir elke kwartaal. Dit is hier waar die regressiewe kom uit in outoregressiewe. Dit is in wese 'n regressiemodel waar die vorige terme is die voorspellers. Outoregressiewe model van orde p 'n tydreeksmodel, is 'n outoregressiewe model van orde p. AR (p), indien: begin xt alfa1 x ldots alphap x wt som p alphai x wt einde Waar is wit geraas en alphai in mathbb, met alphap neq 0 vir 'n p-orde outoregressiewe proses. As ons kyk na die agterste Shift-operateur. (Sien vorige artikel) dan kan ons herskryf bogenoemde as 'n funksie theta van: begin thetap () xt (1 - alfa1 - alfa2 2 - ldots - alphap) xt wt eindig Miskien is die eerste ding om te sien oor die AR (p) model is dat 'n ewekansige loop is eenvoudig AR (1) met alfa1 gelyk aan eenheid. Soos ons hierbo genoem, die autogressive model is 'n uitbreiding van die ewekansige loop, so dit maak sin Dit is maklik om voorspellings met die AR (p) model te maak, vir enige tyd t, as een keer het ons die alphai koëffisiënte bepaal, ons skatting eenvoudig word: begin hoed t alfa1 x ldots alphap x eindig Vandaar kan ons N-stap vorentoe voorspellings te maak deur die vervaardiging hoed t, hoed, hoed, ens tot hoed. Trouens, as ons kyk na die ARMA modelle in Deel 2, sal ons gebruik maak van die R voorspel funksie om voorspellings te maak (saam met die standaard fout vertrouensinterval bands) wat ons sal help produseer handel seine. Stasionariteit vir outoregressiewe prosesse Een van die belangrikste aspekte van die AR (p) model is dat dit nie altyd stilstaan. Inderdaad die stasionariteit van 'n bepaalde model hang af van die parameters. Ive aangeraak oor hierdie voor in 'n vorige artikel. Ten einde vas te stel of 'n AR (p) proses stilstaan of nie moet ons die karakteristieke vergelyking op te los. Die karakteristieke vergelyking is eenvoudig die outoregressiewe model, wat geskryf is in agtertoe skuif vorm, stel aan nul: Ons los die vergelyking vir. Ten einde vir die betrokke outoregressiewe proses stilstaande te wees moet ons al die absolute waardes van die wortels van hierdie vergelyking om eenheid oorskry. Dit is 'n uiters nuttige eiendom en stel ons in staat om vinnig te bereken of 'n AR (p) proses stilstaan of nie. Kom ons kyk na 'n paar voorbeelde om hierdie idee beton te maak: Random Walk - Die AR (1) proses met alfa1 1 het die karakteristieke vergelyking theta 1 -. Dit is duidelik dat het hierdie wortel 1 en as sodanig is nie stilstaan. AR (1) - As ons kies alfa1 frac kry ons xt frac x wt. Dit gee ons 'n karakteristieke vergelyking van 1 - frac 0, wat 'n wortel 4 GT 1 het en so hierdie spesifieke AR (1) proses stilstaan. AR (2) - As ons 'alfa1 alfa2 frac dan kry ons xt frac x frac x wt. Sy kenmerkende vergelyking - frac () () 0, wat twee wortels van 1 gee, -2. Aangesien dit 'n eenheid wortel is dit 'n nie-stasionêre reeks. Maar ander AR (2) reeks kan stilstaande wees. Tweede Orde Properties Die gemiddelde van 'n AR (p) proses is nul. Tog is die autocovariances en outokorrelasies deur rekursiewe funksies, bekend as die Yule-Walker vergelykings. Die volle eienskappe word hieronder gegee: begin MUX E (xt) 0 einde begin gammak som p alphai gamma, enspace k 0 einde begin rhok som p alphai rho, enspace k 0 einde Let daarop dat dit nodig is om die alphai parameterwaardes weet voor berekening van die outokorrelasies. Nou dat weve gesê die tweede orde eienskappe kan ons die verskillende ordes van AR (p) na te boots en plot die ooreenstemmende correlograms. Simulasies en Correlograms AR (1) Kom ons begin met 'n AR (1) proses. Dit is soortgelyk aan 'n ewekansige loop, behalwe dat alfa1 hoef nie gelyk eenheid. Ons model gaan alfa1 0.6 het. Die R-kode vir die skep van hierdie simulasie is soos volg gegee: Let daarop dat ons vir lus is uit 2-100 gedra, nie 1 tot 100, as xt-1 wanneer t0 is nie geïndekseer. Net so vir hoër orde AR (p) prosesse, moet t wissel van p 100 in hierdie lus. Ons kan die verwesenliking van hierdie model en sy verwante correlogram met behulp van die uitleg funksie plot: Kom nou probeer pas 'n AR (p) proses om die gesimuleerde data weve net gegenereer, om te sien of ons die onderliggende parameters kan herstel. Jy kan onthou dat ons 'n soortgelyke prosedure in die artikel oor wit geraas en ewekansige vlakke uitgevoer. Soos dit blyk uit R bied 'n nuttige opdrag ar om outoregressiemodelle pas. Ons kan hierdie metode gebruik om eerstens vir ons sê die beste orde p van die model (soos bepaal deur die AIC hierbo) en voorsien ons met parameter skattings vir die alphai, wat ons dan kan gebruik om vertrouensintervalle vorm. Vir volledigheid, kan herskep die x-reeks: Nou gebruik ons die ar opdrag om 'n outoregressiewe model inpas by ons gesimuleerde AR (1) proses, met behulp van maksimum annneemlikheidsberaming (MLE) as die gepaste prosedure. Ons sal in die eerste plek te onttrek die beste verkry orde: Die opdrag ar suksesvol bepaal dat ons onderliggende tydreeksmodel is 'n AR (1) proses. Ons kan dan verkry die alphai parameter (s) skattings: Die MLE prosedure 'n skatting, hoed 0,523, wat effens laer as die werklike waarde van alfa1 0.6 geproduseer. Ten slotte, kan ons die standaard fout (met die asimptotiese variansie) te gebruik om 95 vertrouensintervalle bou rondom die onderliggende parameter (s). Om dit te bereik, skep ons net 'n vektor c (-1,96, 1.96) en dan vermenigvuldig dit met die standaard fout: Die ware parameter val binne die 95 vertrouensinterval, soos Sun verwag van die feit weve gegenereer die verwesenliking van die model wat spesifiek . Hoe gaan dit as ons verander die alfa1 -0,6 Soos voorheen kan ons 'n AR (p) model met behulp van ar kan inpas: Weereens herstel ons die korrekte volgorde van die model, met 'n baie goeie skatting hoed -0,597 van alpha1-0.6. Ons sien ook dat die ware parameter binne die 95 vertrouensinterval val weer. AR (2) Kom ons voeg 'n bietjie meer ingewikkeld om ons outoregressiewe prosesse deur simuleer 'n model van orde 2. In die besonder, sal ons alpha10.666 stel, maar ook 'alfa2 -0,333. Hier is die volledige kode na te boots en plot die verwesenliking, asook die correlogram vir so 'n reeks: Soos voorheen kan ons sien dat die correlogram aansienlik verskil van dié van wit geraas, as wed verwag. Daar is statisties beduidende hoogtepunte op K1, K3 en K4. Weereens, gaan die ar opdrag gebruik om 'n AR (p) model inpas by ons onderliggende AR (2) besef. Die prosedure is soortgelyk as vir die AR (1) fiks: Die korrekte volgorde is teruggevind en die parameter skat hoed 0,696 en hoed -0,395 is nie te ver van die ware parameterwaardes van alpha10.666 en alpha2-0.333. Let daarop dat ons 'n konvergensie waarskuwingsboodskap ontvang. Let ook op dat R gebruik eintlik die arima0 funksie om die AR model te bereken. Sowel leer in daaropvolgende artikels, AR (p) modelle is eenvoudig ARIMA (p, 0, 0) modelle, en dus 'n AR-model is 'n spesiale geval van ARIMA met geen bewegende gemiddelde (MA) komponent. Wel ook met behulp van die ARIMA opdrag om vertrouensintervalle rondom verskeie parameters te skep, en dit is waarom weve nagelaat het om dit hier te doen. Nou dat weve geskep sommige gesimuleerde data is dit tyd om die AR (p) modelle van toepassing op finansiële bate tydreekse. Finansiële data Amazon Inc. Lets begin deur die verkryging van die aandele prys vir Amazon (AMZN) met behulp van quantmod as in die laaste artikel: Die eerste taak is om altyd plot die prys vir 'n kort visuele inspeksie. In hierdie geval is goed gebruik van die daaglikse sluitingspryse: Jy sal kennis dat quantmod voeg 'n paar opmaak vir ons, naamlik die datum, en 'n effens mooier grafiek as die gewone R kaarte: Ons gaan nou die logaritmiese opbrengste van AMZN neem en dan die eerste - order verskil van die reeks om die oorspronklike prys reeks omskep van 'n nie-stasionêre reeks tot 'n (potensieel) stilstaande een. Dit stel ons in staat om appels te vergelyk met appels tussen aandele, indekse of enige ander bate, vir gebruik in later meerveranderlike statistiek, soos by die berekening van 'n kovariansiematriks. As jy wil graag 'n gedetailleerde verduideliking van waarom log opbrengste is verkieslik, 'n blik op hierdie artikel oor by Quantivity. Kom ons skep 'n nuwe reeks, amznrt. ons differenced log opbrengste te hou: Weereens, kan ons die reeks Plot: In hierdie stadium wil ons die correlogram plot. Soek om te sien of die differenced reeks lyk soos wit geraas. As dit nie gebeur nie, dan is daar onverklaarbare korrelasie, wat verduidelik kan word deur 'n outoregressiewe model. Ons sien 'n statististically beduidende piek by K2. Daar is dus 'n redelike moontlikheid van onverklaarbare korrelasie. Wees bewus egter dat dit te danke aan monsterneming vooroordeel kan wees. As sodanig, kan ons probeer pas 'n AR (p) model om die reeks en produseer vertrouensintervalle vir die parameters: Pas die ar outoregressiewe model om die eerste orde differenced reeks log pryse produseer 'n AR (2) model, met hoed -0,0278 en hoed -0,0687. Ive ook uitset die aysmptotic variansie sodat ons kan standaardfoute vir die parameters te bereken en te produseer vertrouensintervalle. Ons wil om te sien of nul is deel van die 95 vertrouensinterval, asof dit wil sê, dit ons vertroue dat ons 'n ware onderliggende AR (2) proses vir die AMZN reeks verminder. Om die vertrouensintervalle aan die 95 vlak vir elke parameter bereken, gebruik ons die volgende opdragte. Ons neem die vierkantswortel van die eerste element van die asimptotiese variansie matriks om 'n standaard fout te produseer, dan skep vertrouensintervalle deur dit onderskeidelik deur -1,96 en 1,96 vermenigvuldig, vir die vlak 95: Let daarop dat dit 'meer eenvoudig wanneer die gebruik van die ARIMA funksie , maar ook wag totdat Deel 2 voordat behoorlik bekendstelling daarvan. So kan ons sien dat vir alfa1 nul is vervat in die vertroue interval, terwyl dit vir alfa2 nul is nie vervat in die vertroue interval. Daarom moet ons baie versigtig wees om te dink dat ons regtig 'n onderliggende generatiewe AR (2) model vir AMZN wees. In die besonder ons daarop let dat die outoregressiewe model nie in ag neem wisselvalligheid groepering, wat lei tot die groepering van korrelasie in finansiële tydreekse. Wanneer ons kyk na die boog en GARCH modelle in latere artikels, sal ons rekenskap gee vir hierdie. Wanneer ons by die volle ARIMA funksie gebruik in die volgende artikel sal ons voorspellings van die daaglikse log prys reeks te maak ten einde ons in staat stel om handel seine te skep. SampP500 VSA Equity Index Saam met individuele aandele wat ons kan dit ook oorweeg om die VSA Equity indeks, die SampP500. Kom ons pas al die vorige opdragte aan hierdie reeks en produseer die erwe soos voorheen: Ons kan die pryse Plot: Soos voorheen, goed te skep die eerste orde verskil van die log sluitingstyd pryse: Weereens, kan ons die reeks Plot: Dit is duidelik van hierdie grafiek dat die wisselvalligheid is nie stilstaande in die tyd. Dit word ook weerspieël in die plot van die correlogram. Daar is baie pieke, insluitend k1 en k2, wat statisties beduidend verder as 'n wit geraas model is. Daarbenewens sien ons bewyse van 'n lang-geheue prosesse as daar is 'n paar statisties beduidende hoogtepunte by K16, k18 en K21: Uiteindelik sal ons 'n meer gesofistikeerde model as 'n outoregressiewe model van orde p nodig. Maar op hierdie stadium kan ons nog steeds probeer pas so 'n model. Kom ons kyk wat ons kry as ons so: Gebruik ar produseer 'n AR (22) model, dit wil sê 'n model met 22 nie-nul parameters Wat beteken dit vir ons sê dit is 'n aanduiding dat daar waarskynlik 'n baie meer kompleksiteit in die reeks korrelasie as 'n eenvoudige lineêre model van verlede pryse kan regtig verantwoordelik vir. Maar ons het reeds hierdie geweet, want ons kan sien dat daar 'n beduidende korrelasie in die wisselvalligheid. Byvoorbeeld, kyk na die baie volatiel tydperk rondom 2008. Dit motiveer die volgende stel modelle, naamlik die bewegende gemiddelde MA (Q) en die outoregressiewe bewegende gemiddelde ARMA (p, q). Wel leer oor albei hierdie in Deel 2 van hierdie artikel. Soos ons herhaaldelik noem, sal hierdie uiteindelik lei ons om die ARIMA en GARCH familie van modelle, wat albei 'n baie beter geskik is om die korrelasie kompleksiteit van die Samp500 voorsien. Dit sal ons in staat stel om ons voorspellings aansienlik verbeter en uiteindelik produseer meer winsgewend strategieë. Michael Saal-Moore Mike is die stigter van QuantStart en is betrokke by die kwantitatiewe finansiële sektor vir die afgelope vyf jaar, in die eerste plek as 'n quant ontwikkelaar en later as 'n quant handelaar konsultasie vir verskansingsfondse.
No comments:
Post a Comment