Metode analize vremenskih serija uključuju. Vodič: Analiza vremenskih serija

Pretplatite se
Pridružite se zajednici “koon.ru”!
U kontaktu sa:

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Federalna agencija za obrazovanje

Volgogradski državni tehnički univerzitet

KONTROLAPOSAO

po disciplini: MModeli i metode u ekonomiji

na temu "Analiza vremenske serije"

Izvršila: učenica grupe EZB 291c Selivanova O.V.

Volgograd 2010

Uvod

Klasifikacija vremenskih serija

Metode analize vremenskih serija

Zaključak

Književnost

Uvod

Proučavanje dinamike društveno-ekonomskih pojava, identifikacija i karakterizacija glavnih razvojnih trendova i obrazaca međuodnosa daje osnovu za predviđanje, odnosno određivanje budućih dimenzija ekonomskog fenomena.

Pitanja predviđanja postaju posebno aktuelna u kontekstu prelaska na međunarodne sisteme i metode računovodstva i analize društveno-ekonomskih pojava.

Statističke metode zauzimaju značajno mjesto u računovodstvenom sistemu. Primjena i upotreba predviđanja pretpostavlja da obrazac razvoja koji je funkcionisao u prošlosti ostaje isti u predviđenoj budućnosti.

Stoga je proučavanje metoda za analizu kvaliteta prognoza danas vrlo relevantno. Upravo je ova tema izabrana za predmet istraživanja u ovom radu.

Vremenski niz je vremenski uređen niz vrijednosti neke proizvoljne varijable. Svaka pojedinačna vrijednost ove varijable naziva se brojač vremenske serije. Dakle, vremenska serija se značajno razlikuje od jednostavnog uzorka podataka.

Klasifikacija vremenskih serija

Vremenske serije se klasifikuju prema sledećim kriterijumima.

1. Prema obliku prezentacije nivoa:

Š serija apsolutnih indikatora;

Š relativni indikatori;

Sh prosječne veličine.

2. Po prirodi vremenskog parametra:

Sh trenutno. U trenutnim vremenskim serijama, nivoi karakterišu vrednosti indikatora u određenim vremenskim tačkama. U intervalnim serijama, nivoi karakterišu vrijednost indikatora za određene vremenske periode.

Š intervalne vremenske serije. Važna karakteristika intervalnih vremenskih serija apsolutnih vrijednosti je mogućnost sumiranja njihovih nivoa.

3. Po udaljenosti između datuma i vremenskih intervala:

Š kompletan (jednako raspoređen) - kada datumi registracije ili kraj perioda slijede jedan za drugim u jednakim intervalima.

Š nepotpuna (nisu jednako razmaknuta) - kada se ne poštuje princip jednakih intervala.

4. Ovisno o prisutnosti glavnog trenda:

Š stacionarni niz - u kojem su srednja vrijednost i varijansa konstantne.

Š nestacionarni - sadrži glavni trend razvoja.

Metode analize vremenskih serija

Vremenske serije se proučavaju u različite svrhe. U jednom nizu slučajeva može biti dovoljno dobiti opis karakterističnih osobina serije, dok je u drugom nizu slučajeva potrebno ne samo predvidjeti buduće vrijednosti vremenske serije, već i kontrolisati njene ponašanje. Metoda analize vremenskih serija određena je, s jedne strane, ciljevima analize, as druge strane vjerovatnoćom formiranja njenih vrijednosti.

Metode analize vremenskih serija.

1. Spektralna analiza. Omogućava vam da pronađete periodične komponente vremenske serije.

2. Analiza korelacije. Omogućava vam da pronađete značajne periodične zavisnosti i odgovarajuća kašnjenja (kašnjenja) kako unutar jedne serije (autokorelacija) tako i između nekoliko serija. (unakrsna korelacija)

3. Sezonski Box-Jenkins model. Koristi se kada vremenska serija sadrži jasno izražen linearni trend i sezonske komponente. Omogućava vam da predvidite buduće vrijednosti serije. Model je predložen u vezi sa analizom vazdušnog saobraćaja.

4. Predviđanje korištenjem eksponencijalno ponderiranog pokretnog prosjeka. Najjednostavniji model predviđanja vremenskih serija. Primjenjivo u mnogim slučajevima. Ovo uključuje model određivanja cijena zasnovan na slučajnim šetnjama.

Target spektralna analiza- razložiti niz na funkcije sinusa i kosinusa različitih frekvencija, kako bi se odredili oni čiji je izgled posebno značajan i značajan. Jedan od mogućih načina da se to učini je rješavanje problema linearne višestruke regresije, gdje je zavisna varijabla promatrana vremenska serija, a nezavisne varijable ili regresori funkcije sinusa svih mogućih (diskretnih) frekvencija. Takav linearni model višestruke regresije može se napisati kao:

x t = a 0 + (za k = 1 do q)

Sljedeći opći koncept klasične harmonijske analize u ovoj jednačini je (lambda) - ovo je kružna frekvencija izražena u radijanima po jedinici vremena, tj. = 2** k, gdje je konstanta pi = 3,1416 i k = k/q. Ovdje je važno shvatiti da se računski problem uklapanja sinusnih i kosinusnih funkcija različitih dužina podacima može riješiti korištenjem višestruke linearne regresije. Imajte na umu da su koeficijenti a k ​​za kosinuse i koeficijenti b k za sinuse koeficijenti regresije koji ukazuju na stepen do kojeg su odgovarajuće funkcije povezane sa podacima. Postoji q različitih sinusa i kosinusa; Intuitivno je jasno da broj funkcija sinusa i kosinusa ne može biti veći od broja podataka u nizu. Ne ulazeći u detalje, napominjemo da ako je n količina podataka, tada će postojati n/2+1 kosinusnih funkcija i n/2-1 sinusnih funkcija. Drugim riječima, bit će onoliko različitih sinusnih valova koliko ima podataka i moći ćete u potpunosti reproducirati niz prema glavnim funkcijama.

Kao rezultat, spektralna analiza utvrđuje korelaciju sinusnih i kosinusnih funkcija različitih frekvencija sa posmatranim podacima. Ako je pronađena korelacija (koeficijent kod određenog sinusa ili kosinusa) velika, onda možemo zaključiti da postoji jaka periodičnost na odgovarajućoj frekvenciji u podacima.

Analiza distribuirano zaostajanje je posebna metoda za procjenu zaostalih odnosa između serija. Na primjer, pretpostavimo da proizvodite kompjuterske programe i želite uspostaviti odnos između broja zahtjeva primljenih od kupaca i broja stvarnih narudžbi. Možete snimati ove podatke mjesečno godinu dana, a zatim pogledati odnos između dvije varijable: broj zahtjeva i broj narudžbi ovisi o zahtjevima, ali ovisi o kašnjenju. Međutim, jasno je da zahtjevi prethode nalozima, pa možemo očekivati ​​da će broj naloga biti veći. Drugim riječima, postoji vremenski pomak (kašnjenje) u odnosu između broja zahtjeva i broja prodaja (vidi također autokorelacije i unakrsne korelacije).

Zavisnosti ove vrste sa zaostajanjem posebno se često javljaju u ekonometriji. Na primjer, prihod od ulaganja u novu opremu neće se jasno pojaviti odmah, već tek nakon određenog vremena. Veći prihodi mijenjaju stambene izbore ljudi; međutim, ova zavisnost se očigledno manifestuje i sa zakašnjenjem.

U svim ovim slučajevima postoji nezavisna ili eksplanatorna varijabla koja utječe na zavisne varijable s određenim kašnjenjem (lag). Metoda distribuiranog kašnjenja omogućava proučavanje ove vrste zavisnosti.

Opšti model

Neka je y zavisna varijabla i neka je x nezavisna ili objašnjavajuća varijabla. Ove varijable se mjere nekoliko puta tokom određenog vremenskog perioda. U nekim udžbenicima ekonometrije, zavisna varijabla se naziva i endogena varijabla, a zavisna ili objašnjena varijabla je egzogena varijabla. Najjednostavniji način da se opiše odnos između ove dvije varijable dat je sljedećom linearnom jednačinom:

U ovoj jednačini, vrijednost zavisne varijable u trenutku t je linearna funkcija varijable x mjerene u vremenima t, t-1, t-2, itd. Dakle, zavisna varijabla je linearna funkcija x i x pomaknuta za 1, 2, itd. vremenskim periodima. Beta koeficijenti (i) se mogu smatrati parametrima nagiba u ovoj jednačini. Ovu jednačinu ćemo smatrati posebnim slučajem jednačine linearne regresije. Ako je koeficijent varijable sa određenim kašnjenjem značajan, onda možemo zaključiti da je varijabla y predviđena (ili objašnjena) sa kašnjenjem.

Postupci procjene parametara i predviđanja opisani u ovom dijelu pretpostavljaju da je matematički model procesa poznat. U stvarnim podacima često nema jasno definisanih regularnih komponenti. Pojedinačna zapažanja sadrže značajnu grešku, dok ne želite samo da izolujete regularne komponente, već i da napravite prognozu. ARIMA metodologija koju su razvili Box i Jenkins (1976) dozvoljava da se to uradi. Ova metoda je izuzetno popularna u mnogim aplikacijama, a praksa je dokazala njenu moć i fleksibilnost (Hoff, 1983; Pankratz, 1983; Vandaele, 1983). Međutim, zbog svoje snage i fleksibilnosti, ARIMA je složena metoda. Nije jednostavan za upotrebu i potrebno je mnogo prakse da biste ga savladali. Iako često daje zadovoljavajuće rezultate, oni ovise o vještini korisnika (Bails and Peppers, 1982). Sljedeći odjeljci će vas upoznati s njegovim glavnim idejama. Za one koji su zainteresovani za sažet, aplikativni (nematematički) uvod u ARIMA, preporučujemo McClearyja, Meidingera i Haya (1980).

ARIMA model

Opšti model koji su predložili Box i Jenkins (1976) uključuje i autoregresivne i pokretne parametre. Naime, postoje tri tipa parametara modela: parametri autoregresije (p), red razlike (d), parametri pokretnog prosjeka (q). U Box i Jenkins notaciji, model je napisan kao ARI (p, d, q). Na primjer, model (0, 1, 2) sadrži 0 (nula) parametara automatske regresije (p) i 2 parametra pokretnog prosjeka (q), koji se izračunavaju za seriju nakon što se uzme razlika s kašnjenjem 1.

Kao što je ranije navedeno, ARIMA model zahtijeva da serija bude stacionarna, što znači da je njena srednja vrijednost konstantna i da se varijansa uzorka i autokorelacija ne mijenjaju tokom vremena. Stoga je obično potrebno uzeti razlike niza dok ne postane stacionaran (logaritamska transformacija se često koristi i za stabilizaciju varijanse). Broj razlika koje su uzete za postizanje stacionarnosti određen je parametrom d (vidi prethodni odjeljak). Da biste odredili potreban redoslijed razlike, potrebno je ispitati graf serije i autokorelogram. Velike promjene u nivou (veliki skokovi gore ili dolje) obično zahtijevaju uzimanje razlike prvog reda van sezone (lag=1). Velike promjene nagiba zahtijevaju uzimanje razlike drugog reda. Sezonska komponenta zahtijeva uzimanje odgovarajuće sezonske razlike (vidi dolje). Ako postoji sporo smanjenje koeficijenata autokorelacije uzorka ovisno o kašnjenju, obično se uzima razlika prvog reda. Međutim, treba imati na umu da je za neke vremenske serije potrebno uzeti razlike malog reda ili nikako. Imajte na umu da preveliki broj uzetih razlika dovodi do manje stabilnih procjena koeficijenta.

U ovoj fazi (koja se obično naziva identifikacija redoslijeda modela, vidi dolje) također morate odlučiti koliko parametara automatske regresije (p) i pokretnog prosjeka (q) treba biti prisutno u efikasnom i štedljivom modelu procesa. (Štedljivost modela znači da ima najmanji broj parametara i najviše stupnjeva slobode od bilo kojeg modela koji odgovara podacima.) U praksi je vrlo rijetko da je broj parametara p ili q veći od 2 (vidi dolje za potpuniju raspravu).

Sljedeći korak nakon identifikacije (Estimation) sastoji se od procjene parametara modela (za koje se koriste procedure minimizacije funkcije gubitka, vidi dolje; detaljnije informacije o procedurama minimizacije date su u odjeljku Nelinearna procjena). Dobijene procjene parametara se koriste u posljednjoj fazi (Prognoza) kako bi se izračunale nove vrijednosti serije i konstruirao interval pouzdanosti za prognozu. Proces procjene se provodi na transformiranim podacima (podložni primjeni operatora razlike). Prije nego što napravite prognozu, morate izvršiti operaciju obrnutog (integrirati podatke). Na taj način će se prognoza metodologije uporediti sa odgovarajućim ulaznim podacima. Integracija podataka je označena slovom P u opštem nazivu modela (ARMA = Auto Regression Integrated Moving Average).

Dodatno, ARIMA modeli mogu sadržavati konstantu, čija interpretacija ovisi o modelu koji se ugrađuje. Naime, ako (1) u modelu nema parametara autoregresije, tada je konstanta prosječna vrijednost serije, ako (2) postoje parametri autoregresije, tada je konstanta slobodan pojam. Ako je uzeta razlika serije, tada konstanta predstavlja srednji ili slobodni član transformiranog niza. Na primjer, ako je uzeta prva razlika (razlika prvog reda), a u modelu nema parametara autoregresije, tada konstanta predstavlja prosječnu vrijednost transformiranog niza i, prema tome, koeficijent nagiba linearnog trenda originalni.

Eksponencijalno izglađivanje je vrlo popularna metoda za predviđanje mnogih vremenskih serija. Istorijski gledano, metodu su nezavisno otkrili Brown i Holt.

Jednostavno eksponencijalno izglađivanje

Jednostavan i pragmatično jasan model vremenske serije izgleda ovako:

gdje je b konstanta i (epsilon) je slučajna greška. Konstanta b je relativno stabilna u svakom vremenskom intervalu, ali se također može sporo mijenjati tokom vremena. Jedan intuitivan način za izdvajanje b je korištenje izglađivanja pokretnog prosjeka, u kojem najnovija zapažanja dobivaju veće težine od pretposljednjih, a pretposljednja imaju veće težine od pretposljednjih one, i tako dalje. Upravo ovako radi jednostavna eksponencijalna. Ovdje se eksponencijalno opadajuće težine dodjeljuju starijim opservacijama i, za razliku od pokretnog prosjeka, uzimaju se u obzir sva prethodna opažanja serije, a ne ona koja su bila unutar određenog prozora. Tačna formula za jednostavno eksponencijalno izglađivanje je sljedeća:

S t = *X t + (1-)*S t-1

Kada se ova formula primenjuje rekurzivno, svaka nova izglađena vrednost (koja je takođe prognoza) se izračunava kao ponderisani prosek trenutnog posmatranja i izglađene serije. Očigledno, rezultat izglađivanja zavisi od parametra (alfa). Ako je jednako 1, prethodna zapažanja se potpuno zanemaruju. Ako je jednako 0, trenutna zapažanja se zanemaruju. Vrijednosti između 0,1 daju srednje rezultate.

Empirijska istraživanja Makridakisa i drugih (1982; Makridakis, 1983) su pokazala da često jednostavno eksponencijalno izglađivanje daje prilično tačnu prognozu.

Odabir najbolje vrijednosti parametra (alfa)

Gardner (1985) raspravlja o različitim teoretskim i empirijskim argumentima za odabir određenog parametra za izglađivanje. Očigledno, iz gornje formule proizilazi da mora pasti između 0 (nula) i 1 (iako Brenner et al., 1968. za dalju primjenu ARIMA analize smatraju da je 0<<2). Gardner (1985) сообщает, что на практике обычно рекомендуется брать меньше.30. Однако в исследовании Makridakis et al., (1982), большее.30, часто дает лучший прогноз. После обзора литературы, Gardner (1985) приходит к выводу, что лучше оценивать оптимально по данным (см. ниже), чем просто "гадать" или использовать искусственные рекомендации.

Procjena najbolje vrijednosti pomoću podataka. U praksi, parametar izglađivanja se često pronalazi pomoću pretraživanja mreže. Moguće vrijednosti parametara podijeljene su u mrežu s određenim korakom. Na primjer, razmotrite mrežu vrijednosti od = 0,1 do = 0,9, sa korakom od 0,1. Zatim se bira za koji je zbroj kvadrata (ili srednjih kvadrata) reziduala (opažene vrijednosti minus predviđanja korak naprijed) minimalan.

Dobrota fit indeksa

Najizravniji način za procjenu predviđanja na temelju određene vrijednosti je iscrtavanje uočenih vrijednosti i predviđanja za jedan korak naprijed. Ovaj grafikon također uključuje ostatke (iscrtane na desnoj Y osi). Grafikon jasno pokazuje u kojim oblastima je prognoza bolja ili lošija.

Ova vizualna provjera točnosti prognoze često daje najbolje rezultate. Postoje i druge mjere greške koje se mogu koristiti za određivanje optimalnog parametra (vidi Makridakis, Wheelwright i McGee, 1983):

Prosječna greška. Prosječna greška (SE) se izračunava jednostavnim usrednjavanjem grešaka u svakom koraku. Očigledan nedostatak ove mjere je što se pozitivne i negativne greške međusobno poništavaju, tako da nije dobar pokazatelj kvaliteta prognoze.

Prosječna apsolutna greška. Srednja apsolutna greška (MAE) se izračunava kao prosjek apsolutnih grešaka. Ako je jednako 0 (nula), onda imamo savršeno uklapanje (predviđanje). U poređenju sa srednjom kvadratnom greškom, ova mjera "ne daje preveliku težinu" autlijerima.

Zbroj grešaka na kvadrat (SSE), srednja kvadratna greška. Ove vrijednosti se izračunavaju kao zbir (ili srednja vrijednost) kvadrata grešaka. Ovo su najčešće korišteni indeksi dobrote uklapanja.

Relativna greška (RO). Sve prethodne mjere su koristile stvarne vrijednosti greške. Čini se prirodnim izraziti indekse dobrote u skladu sa relativnim greškama. Na primjer, kada predviđate mjesečnu prodaju, koja može jako varirati (na primjer, sezonski) iz mjeseca u mjesec, možete biti prilično zadovoljni prognozom ako ima tačnost od ?10%. Drugim riječima, prilikom predviđanja apsolutna greška možda neće biti toliko interesantna kao relativna. Da bi se objasnila relativna greška, predloženo je nekoliko različitih indeksa (vidi Makridakis, Wheelwright i McGee, 1983). U prvom, relativna greška se izračunava kao:

OO t = 100*(X t - F t)/X t

gdje je X t promatrana vrijednost u trenutku t, a F t je prognoza (izglađena vrijednost).

Prosječna relativna greška (RME). Ova vrijednost se izračunava kao prosjek relativnih grešaka.

Srednja apsolutna relativna greška (MAER). Kao i kod normalne prosječne greške, negativne i pozitivne relativne greške će jedna drugu poništiti. Stoga je za procjenu kvaliteta uklapanja u cjelini (za cijelu seriju) bolje koristiti prosječnu apsolutnu relativnu grešku. Često je ova mjera izražajnija od srednje kvadratne greške. Na primjer, saznanje da je tačnost prognoze ±5% korisno je samo po sebi, dok se vrijednost od 30,8 za srednju kvadratnu grešku ne može tako lako interpretirati.

Automatsko traženje najboljeg parametra. Da bi se minimizirala srednja kvadratna greška, srednja apsolutna greška ili srednja apsolutna relativna greška, koristi se kvazi-njutnova procedura (isto kao ARIMA). U većini slučajeva, ovaj postupak je efikasniji od uobičajenog pretraživanja mreže (posebno ako postoji nekoliko parametara za izravnavanje), a optimalna vrijednost se može brzo pronaći.

Prva izglađena vrijednost S 0 . Ako ponovo pogledate formulu za jednostavno eksponencijalno izglađivanje, vidjet ćete da morate imati vrijednost S 0 da biste izračunali prvu izglađenu vrijednost (predviđanje). Ovisno o izboru parametra (posebno ako je blizu 0), početna vrijednost izglađenog procesa može imati značajan utjecaj na prognozu za mnoga naredna opažanja. Kao i kod drugih preporuka za korištenje eksponencijalnog izglađivanja, preporučuje se da se uzme početna vrijednost koja daje najbolje predviđanje. S druge strane, utjecaj izbora opada s dužinom serije i postaje nekritičan s velikim brojem opservacija.

ekonomske vremenske serije statističke

Zaključak

Analiza vremenskih serija je skup matematičkih i statističkih metoda analize koji su dizajnirani da identifikuju strukturu vremenskih serija i za njihovu prognozu. Ovo uključuje, posebno, metode regresione analize. Identifikacija strukture vremenske serije je neophodna da bi se izgradio matematički model fenomena koji je izvor analiziranog vremenskog niza. Predviđanje budućih vrijednosti vremenske serije koristi se za efikasno donošenje odluka.

Vremenske serije se proučavaju u različite svrhe. Metoda analize vremenskih serija određena je, s jedne strane, ciljevima analize, as druge strane vjerovatnoćom formiranja njenih vrijednosti.

Glavne metode za proučavanje vremenskih serija su:

Š Spektralna analiza.

Š Korelaciona analiza

Š Seasonal Box-Jenkins model.

Š Prognoza eksponencijalno ponderisanim pokretnim prosjekom.

Književnost

1. Bezručko B. P., Smirnov D. A. Matematičko modeliranje i haotične vremenske serije. -- Saratov: Državni naučni centar "Koledž", 2005. -- ISBN 5-94409-045-6

2. Blekhman I. I., Myshkis A. D., Panovko N. G., Primijenjena matematika: Predmet, logika, karakteristike pristupa. Sa primjerima iz mehanike: Udžbenik. -- 3. izdanje, rev. i dodatne - M.: URSS, 2006. - 376 str. ISBN 5-484-00163-3

3. Uvod u matematičko modeliranje. Tutorial. Ed. P.V. Trusova. - M.: Logos, 2004. - ISBN 5-94010-272-7

4. Gorban A.N., Khlebopros R.G., Darwinov demon: ideja optimalnosti i prirodne selekcije. -- M: Nauka. Glavni ed. fizike i matematike lit., 1988. -- 208 str. (Problemi nauke i tehničkog napretka) ISBN 5-02-013901-7 (Poglavlje „Izrada modela“).

5. Journal of Mathematical Modeling (osnovan 1989.)

6. Malkov S. Yu., 2004. Matematičko modeliranje povijesne dinamike: pristupi i modeli // Modeliranje društveno-političke i ekonomske dinamike / Ed. M. G. Dmitriev. - M.: RGSU. -- Sa. 76-188.

7. Myshkis A.D., Elementi teorije matematičkih modela. -- 3. izdanje, rev. -- M.: KomKniga, 2007. -- 192 s ISBN 978-5-484-00953-4

8. Samarsky A. A., Mikhailov A. P. Matematičko modeliranje. Ideje. Metode. Primjeri.. - 2. izd., revidirano.. - M.: Fizmatlit, 2001. - ISBN 5-9221-0120-X

9. Sovetov B. Ya., Yakovlev S. A., Modeliranje sistema: Udžbenik. za univerzitete - 3. izd., revidirano. i dodatne - M.: Više. škola, 2001. -- 343 str. ISBN 5-06-003860-2

Objavljeno na Allbest.ru

Slični dokumenti

    Koncept i glavne faze razvoja prognoze. Problemi analize vremenskih serija. Procjena stanja i trendova u razvoju prognoze na osnovu analize vremenske serije SU-167 JSC Mozyrpromstroy, praktične preporuke za njeno poboljšanje.

    kurs, dodan 01.07.2013

    Metodologija za analizu vremenskih serija socio-ekonomskih pojava. Komponente koje formiraju nivoe u analizi vremenskih serija. Procedura za sastavljanje modela izvoza i uvoza Holandije. Nivoi autokorelacije. Korelacija vremenskih serija.

    kurs, dodan 13.05.2010

    Metode za analizu strukture vremenskih serija koje sadrže sezonske fluktuacije. Razmatranje pristupa metode pokretnog prosjeka i konstrukcija aditivnog (ili multiplikativnog) modela vremenske serije. Izračunavanje procjena sezonskih komponenti u multiplikativnom modelu.

    test, dodano 12.02.2015

    Analiza sistema indikatora koji karakterišu i adekvatnost modela i njegovu tačnost; određivanje apsolutnih i prosječnih grešaka prognoze. Osnovni pokazatelji dinamike ekonomskih pojava, upotreba prosječnih vrijednosti za ujednačavanje vremenskih serija.

    test, dodano 13.08.2010

    Suština i posebnosti statističkih metoda analize: statističko posmatranje, grupisanje, analiza vremenskih serija, indeks, uzorak. Procedura za analizu vremenskih serija, analiziranje glavnog trenda razvoja vremenskih serija.

    kurs, dodan 09.03.2010

    Provođenje eksperimentalnog statističkog istraživanja društveno-ekonomskih pojava i procesa u Smolenskoj regiji na osnovu navedenih indikatora. Konstrukcija statističkih grafova, distribucijskih serija, varijacionih serija, njihova generalizacija i evaluacija.

    kurs, dodan 15.03.2011

    Vrste vremenskih serija. Zahtjevi za početne informacije. Deskriptivne karakteristike dinamike društveno-ekonomskih pojava. Predviđanje korištenjem metode eksponencijalnog prosjeka. Glavni indikatori dinamike ekonomskih pokazatelja.

    test, dodano 02.03.2012

    Pojam i značenje vremenske serije u statistici, njena struktura i glavni elementi, značenje. Klasifikacija i vrste vremenskih serija, karakteristike obima njihove primene, distinktivne karakteristike i postupak određivanja dinamike, faza, serija u njima.

    test, dodano 13.03.2010

    Definisanje koncepta cijena proizvoda i usluga; principe njihove registracije. Obračun pojedinačnih i opštih indeksa troškova robe. Suština osnovnih metoda socio-ekonomskih istraživanja - strukturni prosjeci, distribucijski nizovi i dinamički nizovi.

    kurs, dodan 05.12.2011

    Mašinsko učenje i statističke metode za analizu podataka. Procjena tačnosti prognoze. Prethodna obrada podataka. Metode klasifikacije, regresija i analiza vremenskih serija. Najbliži susjedi, pomoćne vektorske mašine, metode ispravljanja prostora.

Svrha analize vremenskih serija je obično da se konstruiše matematički model serije, uz pomoć kojeg se može objasniti njeno ponašanje i napraviti prognoza za određeni vremenski period. Analiza vremenskih serija uključuje sljedeće glavne korake.

Analiza vremenske serije obično počinje konstrukcijom i proučavanjem njenog grafa.

Ako je nestacionarna priroda vremenske serije očigledna, tada je prvi korak izolovati i ukloniti nestacionarnu komponentu serije. Proces uklanjanja trenda i drugih komponenti serije koje dovode do narušavanja stacionarnosti može se odvijati u nekoliko faza. Svaki od njih ispituje niz reziduala dobijenih oduzimanjem odabranog modela trenda od originalne serije, ili rezultat razlike i drugih transformacija serije. Pored grafova, znakovi nestacionarnosti vremenske serije mogu biti naznačeni autokorelacionom funkcijom koja ne teži nuli (sa izuzetkom veoma velikih vrednosti kašnjenja).

Izbor modela za vremensku seriju. Nakon što je početni proces što je moguće bliže stacionarnom, možete početi birati različite modele rezultirajućeg procesa. Svrha ove faze je da se opiše i uzme u obzir u daljoj analizi korelaciona struktura procesa koji se razmatra. U praksi se najčešće koriste parametarski autoregresivni modeli pokretnih prosjeka (ARIMA modeli).

Model se može smatrati uklopljenim ako je rezidualna komponenta serije proces tipa "bijeli šum", kada su reziduali raspoređeni prema normalnom zakonu sa srednjom uzorkom jednakom 0. Nakon uklapanja modela, obično se izvodi sljedeće :

    procjena disperzije reziduala, koja se kasnije može koristiti za konstruiranje intervala povjerenja za prognozu;

    analiza reziduala kako bi se provjerila adekvatnost modela.

Predviđanje i interpolacija. Posljednja faza analize vremenske serije može biti predviđanje njene budućnosti (ekstrapolacija) ili vraćanje nedostajućih (interpolacija) vrijednosti i ukazivanje na tačnost ove prognoze na osnovu odabranog modela. Nije uvijek moguće odabrati dobar matematički model za vremensku seriju. Dvosmislenost u izboru modela može se uočiti kako u fazi izolacije determinističke komponente niza, tako i pri odabiru strukture niza ostataka. Stoga istraživači često pribjegavaju metodi nekoliko prognoza napravljenih korištenjem različitih modela.

Metode analize. Sljedeće metode se obično koriste u analizi vremenskih serija:

    grafičke metode za prikazivanje vremenskih serija i njihovih popratnih numeričkih karakteristika;

    metode redukcije na stacionarne procese: detrendiranje, modeli pokretnih prosjeka i autoregresija;

    metode za proučavanje unutrašnjih veza između elemenata vremenskih serija.

3.5. Grafičke metode za analizu vremenskih serija

Zašto su potrebne grafičke metode? U studijama uzoraka, najjednostavnije numeričke karakteristike deskriptivne statistike (srednja vrijednost, medijan, varijansa, standardna devijacija) obično daju prilično informativnu sliku uzorka. Grafičke metode za predstavljanje i analizu uzoraka imaju samo pomoćnu ulogu, omogućavajući bolje razumijevanje lokalizacije i koncentracije podataka, zakona njihove distribucije.

Uloga grafičkih metoda u analizi vremenskih serija je potpuno drugačija. Činjenica je da tabelarni prikaz vremenske serije i deskriptivna statistika najčešće ne omogućavaju razumijevanje prirode procesa, dok se iz grafikona vremenskih serija može izvući dosta zaključaka. U budućnosti se mogu provjeriti i rafinirati pomoću proračuna.

Kada analizirate grafikone, možete prilično pouzdano odrediti:

    prisustvo trenda i njegova priroda;

    prisutnost sezonskih i cikličkih komponenti;

    stepen glatkosti ili diskontinuiteta promena uzastopnih vrednosti niza nakon što je trend eliminisan. Po ovom pokazatelju može se suditi o prirodi i veličini korelacije između susjednih elemenata serije.

Konstrukcija i proučavanje grafa. Crtanje grafa vremenske serije uopće nije tako jednostavan zadatak kao što se čini na prvi pogled. Savremeni nivo analize vremenskih serija podrazumeva korišćenje jednog ili drugog kompjuterskog programa za konstruisanje njihovih grafova i svih naknadnih analiza. Većina statističkih paketa i proračunskih tablica opremljena je nekim metodama za postavljanje optimalnog prikaza vremenske serije, ali čak i pri njihovoj upotrebi mogu nastati različiti problemi, na primjer:

    zbog ograničene rezolucije kompjuterskih ekrana, veličina prikazanih grafikona takođe može biti ograničena;

    kod velikih količina analiziranih serija, tačke na ekranu koje predstavljaju posmatranja vremenske serije mogu se pretvoriti u punu crnu traku.

Za borbu protiv ovih poteškoća koriste se različite metode. Prisutnost “lupa” ili “uvećanja” u grafičkoj proceduri omogućava vam da prikažete veći odabrani dio serije, ali u ovom slučaju postaje teško procijeniti prirodu ponašanja serije u cijeloj analiziranoj interval. Morate ispisati grafikone za pojedinačne dijelove serije i spojiti ih da biste vidjeli sliku ponašanja serije u cjelini. Ponekad se koristi za poboljšanje reprodukcije dugih redova stanjivanje, odnosno odabir i prikaz svake sekunde, pete, desete itd. na grafikonu. tačke vremenske serije. Ova procedura održava holistički pogled na seriju i korisna je za otkrivanje trendova. U praksi je korisna kombinacija oba postupka: razbijanje niza na dijelove i stanjivanje, jer omogućavaju određivanje karakteristika ponašanja vremenske serije.

Drugi problem pri reprodukciji grafova stvara emisije– zapažanja koja su po veličini nekoliko puta veća od većine drugih vrijednosti u nizu. Njihovo prisustvo takođe dovodi do nerazlučivosti fluktuacija u vremenskoj seriji, budući da program automatski bira razmeru slike tako da sva zapažanja stanu na ekran. Odabir drugačije skale na y-osi eliminira ovaj problem, ali oštro različita opažanja ostaju izvan ekrana.

Pomoćna grafika. Prilikom analize vremenskih serija često se koriste pomoćni grafovi za numeričke karakteristike serije:

    graf uzorka autokorelacijske funkcije (korelogram) sa zonom povjerenja (cijev) za nultu autokorelacijske funkcije;

    dijagram uzorka parcijalne autokorelacijske funkcije sa zonom povjerenja za nultu parcijalnu autokorelaciju;

    grafikon periodograma.

Prva dva od ovih grafikona omogućavaju suđenje odnosa (ovisnosti) susjednih vrijednosti vremena rad, koriste se pri odabiru parametarskih modela autoregresije i pokretnog prosjeka. Grafikon periodograma omogućava da se proceni prisustvo harmonijskih komponenti u vremenskoj seriji.

16.02.2015. Viktor Gavrilov

44859 0

Vremenska serija je niz vrijednosti koje se mijenjaju tokom vremena. Pokušat ću govoriti o nekim jednostavnim, ali učinkovitim pristupima u radu s takvim sekvencama u ovom članku. Postoji mnogo primjera takvih podataka - kotacije valuta, obim prodaje, zahtjevi kupaca, podaci iz različitih primijenjenih znanosti (sociologija, meteorologija, geologija, zapažanja u fizici) i još mnogo toga.

Serije su uobičajen i važan oblik opisivanja podataka, jer nam omogućavaju da sagledamo čitavu istoriju promena vrednosti koja nas zanima. To nam daje priliku da prosudimo „tipično“ ponašanje neke količine i odstupanja od takvog ponašanja.

Bio sam suočen sa zadatkom da odaberem skup podataka na kojem bi bilo moguće jasno pokazati karakteristike vremenskih serija. Odlučio sam da koristim statistiku međunarodnog saobraćaja putnika jer je ovaj skup podataka vrlo jasan i postao je donekle standard (http://robjhyndman.com/tsdldata/data/airpass.dat, izvor Biblioteka podataka o vremenskim serijama, R. J. Hyndman). Serija opisuje broj međunarodnih putnika mjesečno (u hiljadama) za period od 1949. do 1960. godine.

Pošto mi je uvijek pri ruci, koji ima zanimljiv alat “” za rad sa redovima, koristit ću ga. Prije uvoza podataka u datoteku, potrebno je dodati kolonu s datumom kako bi vrijednosti bile vezane za vrijeme i kolonu s nazivom serije za svako opažanje. U nastavku možete vidjeti kako izgleda moj izvorni fajl, koji sam uvezao u Prognoz Platform koristeći Import Wizard direktno iz alata za analizu vremenskih serija.

Prva stvar koju obično radimo sa vremenskom serijom je da je nacrtamo na grafikonu. Prognoz Platforma vam omogućava da napravite grafikon jednostavnim prevlačenjem niza u radnu svesku.

Vremenske serije na grafikonu

Simbol 'M' na kraju naziva serije znači da serija ima mjesečnu dinamiku (interval između promatranja je mjesec dana).

Već iz grafikona vidimo da serija pokazuje dvije karakteristike:

  • trend– na našem grafikonu ovo je dugoročno povećanje uočenih vrijednosti. Vidi se da je trend skoro linearan.
  • sezonalnost– na grafikonu su to periodične fluktuacije vrijednosti. U sljedećem članku na temu vremenskih serija naučit ćemo kako možemo izračunati period.

Naša serija je prilično "uredna", međutim, često postoje serije koje, pored dvije gore opisane karakteristike, pokazuju još jednu - prisustvo "šuma", tj. slučajne varijacije u ovom ili onom obliku. Primjer takve serije može se vidjeti na grafikonu ispod. Ovo je sinusni val pomiješan sa slučajnom promjenljivom.

Prilikom analize serija, zainteresovani smo da identifikujemo njihovu strukturu i procenimo sve glavne komponente – trend, sezonalnost, buku i druge karakteristike, kao i mogućnost predviđanja promena vrednosti u budućim periodima.

Kada radite sa serijama, prisustvo šuma često otežava analizu strukture serije. Da biste eliminirali njegov utjecaj i bolje vidjeli strukturu serije, možete koristiti metode izglađivanja serije.

Najjednostavniji način izjednačavanja serije je pokretni prosek. Ideja je da za bilo koji neparan broj tačaka u nizu zamenite centralnu tačku aritmetičkom sredinom preostalih tačaka:

Gdje x i– početni red, s i– izglađena serija.

Ispod možete vidjeti rezultat primjene ovog algoritma na naše dvije serije. Prema zadanim postavkama, Prognoz Platforma predlaže korištenje anti-aliasinga s veličinom prozora od 5 bodova ( k u našoj gornjoj formuli to će biti jednako 2). Imajte na umu da na izglađeni signal više ne utiče šum, ali zajedno sa šumom, naravno, nestaju i neke korisne informacije o dinamici serije. Jasno je i da uglađenoj seriji nedostaje prva (a i poslednja) k bodova. To je zbog činjenice da se izglađivanje vrši na središnjoj tački prozora (u našem slučaju trećoj tački), nakon čega se prozor pomiče za jednu tačku, a proračuni se ponavljaju. Za drugu, nasumičnu seriju, koristio sam izglađivanje sa prozorom od 30 da bih bolje identifikovao strukturu serije, pošto je serija „visokofrekventna“ sa puno poena.

Metoda pokretnog prosjeka ima određene nedostatke:

  • Pokretni prosek je neefikasan za izračunavanje. Za svaki bod, prosjek se mora ponovo izračunati. Ne možemo ponovo koristiti rezultat izračunat za prethodnu tačku.
  • Pokretni prosjek se ne može proširiti na prvu i posljednju tačku serije. To može uzrokovati problem ako su to tačke koje nas zanimaju.
  • Pokretni prosjek nije definiran izvan serije, te se kao rezultat toga ne može koristiti za predviđanje.

Eksponencijalno izglađivanje

Naprednija metoda izglađivanja koja se takođe može koristiti za predviđanje je eksponencijalno izglađivanje, koja se ponekad naziva i Holt-Wintersova metoda prema njenim kreatorima.

Postoji nekoliko varijacija ove metode:

  • jedno zaglađivanje za serije koje nemaju trend ili sezonalnost;
  • dvostruko izglađivanje za serije koje imaju trend, ali nemaju sezonalnost;
  • trostruko izglađivanje za serije koje imaju i trend i sezonalnost.

Metoda eksponencijalnog izglađivanja izračunava vrijednosti izglađene serije ažuriranjem vrijednosti izračunatih u prethodnom koraku koristeći informacije iz trenutnog koraka. Informacije iz prethodnih i trenutnih koraka uzimaju se s različitim težinama koje se mogu kontrolisati.

U najjednostavnijoj verziji pojedinačnog zaglađivanja, omjer je:

Parametar α definira odnos između neuglađene vrijednosti u trenutnom koraku i izglađene vrijednosti iz prethodnog koraka. At α =1 uzećemo samo tačke originalnog niza, tj. neće biti zaglađivanja. At α =0 red uzet ćemo samo izglađene vrijednosti iz prethodnih koraka, tj. serija će postati konstanta.

Da bismo razumjeli zašto se izglađivanje naziva eksponencijalno, moramo rekurzivno proširiti odnos:

Iz odnosa je jasno da sve prethodne vrijednosti serije doprinose trenutnoj izglađenoj vrijednosti, ali njihov doprinos eksponencijalno blijedi zbog povećanja stepena parametra α .

Međutim, ako postoji trend u podacima, jednostavno izglađivanje će "zaostajati" za njim (ili ćete morati uzeti vrijednosti α blizu 1, ali tada će izglađivanje biti nedovoljno). Morate koristiti dvostruko eksponencijalno izglađivanje.

Dvostruko izglađivanje već koristi dvije jednačine - jedna jednačina procjenjuje trend kao razliku između trenutne i prethodne izglađene vrijednosti, a zatim izglađuje trend jednostavnim izglađivanjem. Druga jednačina vrši izglađivanje kao u jednostavnom slučaju, ali drugi član koristi zbir prethodne izglađene vrijednosti i trenda.

Trostruko izglađivanje uključuje još jednu komponentu - sezonalnost i koristi drugu jednačinu. U ovom slučaju postoje dvije varijante sezonske komponente - aditivna i multiplikativna. U prvom slučaju, amplituda sezonske komponente je konstantna i ne zavisi tokom vremena od bazne amplitude serije. U drugom slučaju, amplituda se mijenja zajedno sa promjenom osnovne amplitude serije. To je upravo naš slučaj, kao što se vidi iz grafikona. Kako serija raste, amplituda sezonskih fluktuacija se povećava.

Pošto naš prvi red ima i trend i sezonalnost, odlučio sam da za njega odaberem trostruke parametre zaglađivanja. U Prognoz Platformi to je prilično lako učiniti, jer kada se ažurira vrijednost parametra, platforma odmah ponovo iscrtava graf izglađene serije i vizualno se odmah vidi koliko dobro opisuje našu originalnu seriju. Odlučio sam se na sljedeće vrijednosti:

Pogledat ćemo kako sam izračunao period u sljedećem članku o vremenskim serijama.

Obično se vrijednosti između 0,2 i 0,4 mogu smatrati prvim aproksimacijama. Prognoz Platforma također koristi model sa dodatnim parametrom ɸ , što prigušuje trend tako da se približava konstanti u budućnosti. Za ɸ Uzeo sam vrijednost 1, što odgovara normalnom modelu.

Također sam napravio prognozu vrijednosti serije koristeći ovu metodu za posljednje 2 godine. Na donjoj slici sam označio početnu tačku prognoze povlačeći liniju kroz nju. Kao što vidite, originalna serija i izglađena se prilično dobro poklapaju, uključujući i period predviđanja - nije loše za tako jednostavnu metodu!

Prognoz Platforma vam također omogućava da automatski odaberete optimalne vrijednosti parametara pomoću sistematske pretrage u prostoru vrijednosti parametara i minimiziranja sume kvadrata odstupanja izglađene serije od originalne.

Opisane metode su vrlo jednostavne, lake za primjenu i pružaju dobru polaznu tačku za analizu strukture i predviđanja vremenskih serija.

Više o vremenskim serijama pročitajte u sljedećem članku.

Vrste i metode analize vremenskih serija

Vremenska serija je skup uzastopnih mjerenja varijable uzetih u jednakim vremenskim intervalima. Analiza vremenskih serija vam omogućava da rešite sledeće probleme:

  • istražiti strukturu vremenske serije koja, po pravilu, uključuje trend – redovne promjene prosječnog nivoa, kao i slučajne periodične fluktuacije;
  • istražiti uzročno-posljedične veze između procesa koji određuju promjene u serijama, a koje se manifestiraju u korelacijama između vremenskih serija;
  • izgraditi matematički model procesa predstavljenog vremenskom serijom;
  • transformirati vremenske serije koristeći alate za izglađivanje i filtriranje;
  • predvidjeti budući razvoj procesa.

Značajan dio poznatih metoda namijenjen je analizi stacionarnih procesa čija su statistička svojstva, karakterizirana normalnom distribucijom po srednjoj vrijednosti i varijansi, konstantna i ne mijenjaju se tokom vremena.

Ali serije često imaju nestacionarni karakter. Nestacionarnost se može eliminisati na sledeći način:

  • oduzmite trend, tj. promjene prosječne vrijednosti, predstavljene nekom determinističkom funkcijom koja se može odabrati regresionom analizom;
  • izvršiti filtriranje posebnim nestacionarnim filterom.

Standardizirati vremenske serije radi uniformnosti metoda

analizu, preporučljivo je izvršiti njihovo generalno ili sezonsko centriranje dijeljenjem sa prosječnom vrijednošću, kao i normalizaciju dijeljenjem sa standardnom devijacijom.

Centriranjem serije uklanja se srednja vrijednost različita od nule koja može otežati interpretaciju rezultata, na primjer u spektralnoj analizi. Svrha normalizacije je izbjegavanje operacija s velikim brojevima u proračunima, što može dovesti do smanjenja tačnosti proračuna.

Nakon ovih preliminarnih transformacija vremenske serije može se izgraditi njen matematički model prema kojem se vrši predviđanje, tj. Dobijen je neki nastavak vremenske serije.

Da bi se rezultat prognoze uporedio sa originalnim podacima, na njemu se moraju izvršiti transformacije koje su inverzne onima koje su izvršene.

U praksi se najčešće koriste metode modeliranja i predviđanja, a kao pomoćne metode smatraju se korelacija i spektralna analiza. To je zabluda. Metode za predviđanje razvoja prosječnih trendova omogućavaju dobivanje procjena sa značajnim greškama, što otežava predviđanje budućih vrijednosti varijable predstavljene vremenskom serijom.

Metode korelacione i spektralne analize omogućavaju da se identifikuju različita, uključujući inercijalna, svojstva sistema u kojem se razvijaju procesi koji se proučavaju. Upotreba ovih metoda omogućava da se iz trenutne dinamike procesa sa dovoljno pouzdanosti utvrdi kako će i sa kojim zakašnjenjem poznata dinamika uticati na budući razvoj procesa. Za dugoročno predviđanje, ove vrste analiza daju vrijedne rezultate.

Analiza i predviđanje trendova

Analiza trenda je namijenjena proučavanju promjena prosječne vrijednosti vremenske serije uz izgradnju matematičkog modela trenda i na osnovu toga predviđanje budućih vrijednosti serije. Analiza trenda se izvodi konstruiranjem jednostavnih linearnih ili nelinearnih regresijskih modela.

Početni podaci koji se koriste su dvije varijable, od kojih su jedna vrijednosti vremenskog parametra, a druga stvarne vrijednosti vremenske serije. Tokom procesa analize možete:

  • testirati nekoliko matematičkih trend modela i odabrati onaj koji preciznije opisuje dinamiku serije;
  • izgraditi prognozu budućeg ponašanja vremenske serije na osnovu odabranog trend modela sa određenom sigurnošću;
  • ukloniti trend iz vremenske serije kako bi se osigurala njegova stacionarnost, neophodna za korelaciju i spektralnu analizu, a za to je, nakon izračunavanja regresionog modela, potrebno sačuvati ostatke za izvođenje analize.

Različite funkcije i kombinacije koriste se kao trend modeli, kao i power serije, koje se ponekad nazivaju polinomski modeli. Najveću preciznost daju modeli u obliku Fourierovih redova, ali mali broj statističkih paketa dozvoljava korištenje takvih modela.

Ilustrujmo izvođenje modela serijskog trenda. Koristimo niz podataka o američkom bruto nacionalnom proizvodu za period 1929-1978. po trenutnim cijenama. Napravimo model polinomske regresije. Preciznost modela se povećavala sve dok stepen polinoma nije dostigao peti:

Y = 145,6 - 35,67* + 4,59* 2 - 0,189* 3 + 0,00353x 4 + 0,000024* 5,

(14,9) (5,73) (0,68) (0,033) (0,00072) (0,0000056)

Gdje U - BNP, milijarde dolara;

* - godine koje se računaju od prve 1929. godine;

Ispod koeficijenata su njihove standardne greške.

Standardne greške koeficijenata modela su male, ne dostižu vrednosti jednake polovini vrednosti koeficijenata modela. Ovo ukazuje na dobar kvalitet modela.

Koeficijent determinacije modela, jednak kvadratu redukovanog koeficijenta višestruke korelacije, iznosio je 99%. To znači da model objašnjava 99% podataka. Ispostavilo se da je standardna greška modela 14,7 milijardi, a nivo značajnosti nulte hipoteze - hipoteze o nepovezanosti - bio je manji od 0,1%.

Koristeći dobijeni model, moguće je dati prognozu, koja je u poređenju sa stvarnim podacima data u tabeli. PZ. 1.

Prognoza i stvarna veličina američkog BNP-a, milijarde dolara.

Tabela PZ.1

Prognoza dobijena polinomskim modelom nije baš tačna, o čemu svjedoče podaci prikazani u tabeli.

Korelaciona analiza

Korelaciona analiza je neophodna da bi se identifikovale korelacije i njihova kašnjenja – kašnjenja u njihovoj periodičnosti. Komunikacija u jednom procesu se zove autokorelacija, i veza između dva procesa karakterizirana nizom - unakrsne korelacije. Visok nivo korelacije može poslužiti kao indikator uzročno-posledičnih veza, interakcija unutar jednog procesa, između dva procesa, a vrednost kašnjenja ukazuje na vremensko kašnjenje u prenosu interakcije.

Tipično, u procesu izračunavanja vrijednosti korelacijske funkcije na To U ovom koraku izračunava se korelacija između varijabli duž dužine segmenta / = 1,..., (p - k) prvi red X i segment / = To,..., P drugi red K Tako se mijenja dužina segmenata.

Rezultat je vrijednost koja je teška za praktičnu interpretaciju, koja podsjeća na parametarski koeficijent korelacije, ali nije identična njemu. Stoga su mogućnosti korelacione analize, čija se metodologija koristi u mnogim statističkim paketima, ograničene na uski raspon klasa vremenskih serija, koje nisu tipične za većinu ekonomskih procesa.

Ekonomisti u korelacionoj analizi zainteresovani su za proučavanje kašnjenja u prenošenju uticaja sa jednog procesa na drugi ili uticaja početnog poremećaja na kasniji razvoj istog procesa. Za rješavanje takvih problema predložena je modifikacija poznate metode tzv intervalna korelacija".

Kulaichev A.P. Metode i alati za analizu podataka u Windows okruženju. - M.: Informatika i računari, 2003.

Intervalna korelaciona funkcija je niz koeficijenata korelacije izračunatih između fiksnog segmenta prvog reda date veličine i položaja i segmenata jednake veličine drugog reda, odabranih uzastopnim pomacima od početka serije.

Definiciji su dodana dva nova parametra: dužina pomaknutog fragmenta serije i njegova početna pozicija, te se koristi i definicija Pearsonovog koeficijenta korelacije prihvaćena u matematičkoj statistici. To čini izračunate vrijednosti uporedivim i lakim za interpretaciju.

Obično je za izvođenje analize potrebno odabrati jednu ili dvije varijable za autokorelaciju ili unakrsnu korelaciju, a također postaviti sljedeće parametre:

Dimenzija vremenskog koraka analizirane serije za uparivanje

rezultati sa stvarnom vremenskom linijom;

Dužina pomaknutog fragmenta prvog reda, u obliku broja uključenog u

elemenata serije;

Pomak ovog fragmenta u odnosu na početak reda.

Naravno, potrebno je izabrati opciju intervalne korelacije ili neku drugu korelaciju.

Ako je jedna varijabla odabrana za analizu, tada se izračunavaju vrijednosti autokorelacijske funkcije za sukcesivno povećanje kašnjenja. Funkcija autokorelacije nam omogućava da odredimo u kojoj mjeri se dinamika promjena u datom fragmentu reproducira u vlastitim segmentima pomjerenim u vremenu.

Ako su dvije varijable odabrane za analizu, tada se izračunavaju vrijednosti unakrsne korelacijske funkcije za sukcesivno povećanje kašnjenja - pomaka druge odabrane varijable u odnosu na prvu. Funkcija unakrsne korelacije nam omogućava da odredimo u kojoj mjeri se promjene u fragmentu prvog reda reproduciraju u fragmentima drugog reda pomaknutim u vremenu.

Rezultati analize trebaju uključiti procjene kritične vrijednosti koeficijenta korelacije g 0 za hipotezu "r 0= 0" na određenom nivou značajnosti. Ovo vam omogućava da zanemarite statistički beznačajne koeficijente korelacije. Potrebno je dobiti vrijednosti korelacijske funkcije koje ukazuju na kašnjenje. Grafovi auto- ili međukorelacijskih funkcija su vrlo korisni i vizualni.

Ilustrirajmo korištenje unakrsne korelacijske analize primjerom. Procijenimo odnos između stopa rasta BDP-a SAD-a i SSSR-a tokom 60 godina od 1930. do 1979. godine. Da bi se dobile karakteristike dugoročnih trendova, odabran je pomaknut fragment serije da bude dug 25 godina. Kao rezultat, dobijeni su koeficijenti korelacije za različite lagove.

Jedino zaostajanje u kojem se korelacija pokazuje kao značajna je 28 godina. Koeficijent korelacije na ovom lagu je 0,67, dok je prag minimalne vrijednosti 0,36. Pokazalo se da je cikličnost dugoročnog razvoja privrede SSSR-a sa zakašnjenjem od 28 godina bila usko povezana sa cikličnosti dugoročnog razvoja privrede SAD.

Spektralna analiza

Uobičajeni način analize strukture stacionarnih vremenskih serija je korištenje diskretne Fourierove transformacije za procjenu spektralne gustine ili spektra serije. Ova metoda se može koristiti:

  • da dobije deskriptivnu statistiku jedne vremenske serije ili deskriptivnu statistiku zavisnosti između dve vremenske serije;
  • identificirati periodična i kvaziperiodična svojstva nizova;
  • provjeriti adekvatnost modela izgrađenih drugim metodama;
  • za prezentaciju komprimiranih podataka;
  • da se interpolira dinamika vremenskih serija.

Preciznost procjena spektralne analize može se povećati korištenjem posebnih metoda – korištenjem prozora za izravnavanje i metodama usrednjavanja.

Za analizu morate odabrati jednu ili dvije varijable i navesti sljedeće parametre:

  • dimenzija vremenskog koraka analizirane serije, neophodna za koordinaciju rezultata sa skalama realnog vremena i frekvencije;
  • dužina To analizirani segment vremenske serije, u obliku broja podataka koji su u njega uključeni;
  • pomak sljedećeg segmenta reda do 0 u odnosu na prethodni;
  • vrsta vremenskog prozora za uglađivanje za suzbijanje tzv efekat curenja struje;
  • vrsta usrednjavanja frekvencijskih karakteristika izračunatih za uzastopne segmente vremenske serije.

Rezultati analize uključuju spektrograme - vrijednosti karakteristika amplitudno-frekventnog spektra i vrijednosti fazno-frekventnih karakteristika. U slučaju unakrsne spektralne analize, rezultati su i vrijednosti prijenosne funkcije i funkcije koherencije spektra. Rezultati analize mogu uključivati ​​i podatke periodograma.

Amplitudno-frekvencijska karakteristika unakrsnog spektra, koja se naziva i unakrsna spektralna gustina, predstavlja zavisnost amplitude međusobnog spektra dva međusobno povezana procesa o frekvenciji. Ova karakteristika jasno pokazuje na kojim se frekvencijama uočavaju sinhrone i odgovarajuće po veličini promjene snage u dvije analizirane vremenske serije ili gdje se nalaze područja njihovih maksimalnih podudarnosti i maksimalnih neslaganja.

Ilustrirajmo korištenje spektralne analize primjerom. Analizirajmo talase ekonomskih prilika u Evropi u periodu početka industrijskog razvoja. Za analizu koristimo neuglađenu vremensku seriju indeksa cijena pšenice u prosjeku od Beveridgea na osnovu podataka sa 40 evropskih tržišta tokom 370 godina od 1500. do 1869. Dobijamo spektre

serija i njeni pojedinačni segmenti u trajanju od 100 godina svakih 25 godina.

Spektralna analiza vam omogućava da procenite snagu svakog harmonika u spektru. Najmoćniji su talasi sa periodom od 50 godina, koje je, kao što je poznato, otkrio N. Kondratiev 1 i dobio njegovo ime. Analiza nam omogućava da utvrdimo da oni nisu nastali krajem 17. - početkom 19. stoljeća, kako smatraju mnogi ekonomisti. Formirani su od 1725. do 1775. godine.

Konstrukcija autoregresivnih i integrisanih modela pokretnog proseka ( ARIMA) smatraju se korisnim za opisivanje i predviđanje stacionarnih vremenskih serija i nestacionarnih serija koje pokazuju uniformne fluktuacije oko promjenjive srednje vrijednosti.

Modeli ARIMA su kombinacije dva modela: autoregresije (AR) i pokretni prosek (pokretni prosek - MA).

Modeli pokretnih prosjeka (MA) predstavljaju stacionarni proces kao linearnu kombinaciju uzastopnih vrijednosti takozvanog “bijelog šuma”. Pokazalo se da su takvi modeli korisni i kao nezavisni opisi stacionarnih procesa i kao dodatak autoregresivnim modelima za detaljniji opis komponente buke.

Algoritmi za proračun parametara modela MA su vrlo osjetljivi na pogrešan izbor broja parametara za određenu vremensku seriju, posebno u smjeru njihovog povećanja, što može rezultirati nedostatkom konvergencije proračuna. Preporučuje se da se u početnim fazama analize ne odabire model pokretnog prosjeka s velikim brojem parametara.

Preliminarna procjena - prva faza analize pomoću modela ARIMA. Proces preliminarne procjene završava se prihvatanjem hipoteze o adekvatnosti modela vremenskoj seriji ili iscrpljivanjem dozvoljenog broja parametara. Kao rezultat, rezultati analize uključuju:

  • vrijednosti parametara autoregresivnog modela i modela pokretnog prosjeka;
  • za svaki korak prognoze naznačena je prosječna vrijednost prognoze, standardna greška prognoze, interval pouzdanosti prognoze za određeni nivo značajnosti;
  • statistika za procjenu nivoa značajnosti hipoteze nekoreliranih reziduala;
  • grafikoni vremenskih serija koji pokazuju standardnu ​​grešku prognoze.
  • Značajan dio materijala u dijelu PZ baziran je na odredbama knjiga: Basovsky L.E. Predviđanje i planiranje u tržišnim uslovima. - M.: INFRA-M, 2008. Gilmore R. Primijenjena teorija katastrofa: U 2 knjige. Book 1/ Per. sa engleskog M.: Mir, 1984.
  • Jean Baptiste Joseph Fourier (Jean Baptiste Joseph Fourier; 1768-1830) - francuski matematičar i fizičar.
  • Nikolaj Dmitrijevič Kondratjev (1892-1938) - ruski i sovjetski ekonomista.

ANALIZA VREMENSKIH SERIJA


UVOD

POGLAVLJE 1. ANALIZA VREMENSKIH SERIJA

1.1 VREMENSKI NIZ I NJEGOVI OSNOVNI ELEMENTI

1.2 AUTOKORELACIJA NIVOA VREMENSKOG SERIJA I IDENTIFIKACIJA NJEGOVE STRUKTURE

1.3 MODELIRANJE TRENDOVA VREMENSKIH SERIJA

1.4 Metoda najmanjeg kvadrata

1.5 REDUKCIJA JEDNAČINE TRENDA NA LINEARNI FORM

1.6 PROCJENA PARAMETARA REGRESIJE JEDNAČINE

1.7 ADITIVNI I MNOŽENI MODELI VREMENSKIH REDOVA

1.8 STACIONARNI VREMENSKI NIZ

1.9 PRIMJENA BRZE FOURIEROVE TRANSFORMACIJE NA STACIONARNI VREMENSKI RED

1.10 AUTOKORELACIJA REZIDUALA. DURBIN-WATSON KRITERIJ

Uvod

Gotovo u svakoj oblasti postoje fenomeni koji su zanimljivi i važni za proučavanje u njihovom razvoju i promjeni tokom vremena. U svakodnevnom životu mogu biti zanimljivi, na primjer, meteorološki uslovi, cijene određenog proizvoda, određene karakteristike zdravstvenog stanja pojedinca itd. Sve se to mijenja s vremenom. S vremenom se mijenjaju poslovna aktivnost, način određenog proizvodnog procesa, dubina sna i percepcija televizijskog programa. Ukupnost mjerenja bilo koje karakteristike ove vrste u određenom vremenskom periodu predstavlja vremenske serije.

Skup postojećih metoda za analizu takvih serija zapažanja naziva se analiza vremenskih serija.

Glavna karakteristika koja razlikuje analizu vremenskih serija od drugih tipova statističke analize je važnost redosleda u kojem se vrše zapažanja. Ako su u mnogim problemima posmatranja statistički nezavisna, onda su u vremenskim serijama po pravilu zavisna, a priroda ove zavisnosti može se odrediti pozicijom opažanja u nizu. Priroda serije i struktura procesa koji generira niz mogu unaprijed odrediti redoslijed u kojem se niz formira.

Target Rad se sastoji u dobijanju modela za diskretnu vremensku seriju u vremenskom domenu, koja ima maksimalnu jednostavnost i minimalan broj parametara i istovremeno adekvatno opisuje opažanja.

Dobivanje takvog modela važno je iz sljedećih razloga:

1) može pomoći da se razume priroda sistema koji generiše vremenske serije;

2) kontroliše proces koji generiše niz;

3) može se koristiti za optimalno predviđanje budućih vrijednosti vremenskih serija;

Vremenske serije su najbolje opisane nestacionarni modeli, u kojoj se trendovi i druge pseudostabilne karakteristike, koje se eventualno mijenjaju tokom vremena, smatraju statističkim, a ne determinističkim fenomenima. Osim toga, vremenske serije povezane sa ekonomijom često su uočljive sezonski, ili periodične, komponente; ove komponente mogu varirati tokom vremena i moraju biti opisane cikličkim statističkim (moguće nestacionarnim) modelima.

Neka posmatrana vremenska serija bude y 1 , y 2 , . . ., y n . Ovaj unos ćemo razumjeti na sljedeći način. Postoje T brojevi koji predstavljaju posmatranje neke varijable u T jednako udaljenim trenucima u vremenu. Radi praktičnosti, ovi momenti su numerisani celim brojevima 1, 2, . . .,T. Prilično općeniti matematički (statistički ili probabilistički) model je model u obliku:

y t = f(t) + u t , t = 1, 2, . . ., T.

U ovom modelu, posmatrani niz se smatra zbirom nekog potpuno determinističkog niza (f(t)), koji se može nazvati matematičkom komponentom, i slučajnog niza (u t ), koji se povinuje nekom verovatnosnom zakonu. (A ponekad se za ove dvije komponente koriste termini signal i šum). Ove komponente posmatranog niza su neuočljive; one su teorijske veličine. Tačno značenje ove dekompozicije ne ovisi samo o samim podacima, već dijelom i o tome što se podrazumijeva pod ponavljanjem eksperimenta iz kojeg su ti podaci rezultat. Ovdje se koristi takozvana „frekvencijska“ interpretacija. Vjeruje se da je, barem u principu, moguće ponoviti cijelu situaciju, dobijajući nove skupove zapažanja. Slučajne komponente, između ostalog, mogu uključivati ​​i greške opservacije.

Ovaj rad razmatra model vremenske serije u kojem je slučajna komponenta superponirana na trend, formirajući slučajni stacionarni proces. U takvom modelu se pretpostavlja da protok vremena ni na koji način ne utiče na slučajnu komponentu. Preciznije, pretpostavlja se da je matematičko očekivanje (odnosno prosječna vrijednost) slučajne komponente identično jednako nuli, varijansa jednaka nekoj konstanti i da su vrijednosti u t u različitim vremenima nekorelirane. Dakle, bilo koja vremenska zavisnost je uključena u sistematsku komponentu f(t). Niz f(t) može zavisiti od nekih nepoznatih koeficijenata i od poznatih veličina koje se mijenjaju tokom vremena. U ovom slučaju to se naziva „funkcija regresije“. Metode statističkog zaključivanja za koeficijente funkcije regresije pokazale su se korisnim u mnogim oblastima statistike. Jedinstvenost metoda vezanih za vremenske serije je u tome što proučavaju one modele u kojima su gore navedene veličine koje se mijenjaju tokom vremena poznate funkcije t.


Poglavlje 1. Analiza vremenskih serija

1.1 Vremenska serija i njeni glavni elementi

Vremenska serija je skup vrijednosti bilo kojeg indikatora za nekoliko uzastopnih trenutaka ili vremenskih perioda. Svaki nivo vremenske serije formira se pod uticajem velikog broja faktora koji se mogu podeliti u tri grupe:

· faktori koji oblikuju trend serije;

· faktori koji formiraju cikličke fluktuacije u seriji;

· slučajni faktori.

Uz različite kombinacije ovih faktora u procesu ili fenomenu koji se proučava, zavisnost nivoa serije od vremena može imati različite oblike. Prvo, većina vremenskih serija ekonomskih indikatora ima trend koji karakteriše dugoročni kumulativni uticaj mnogih faktora na dinamiku indikatora koji se proučava. Očigledno je da ovi faktori, uzeti odvojeno, mogu imati višesmjerni uticaj na indikator koji se proučava. Međutim, zajedno čine trend rasta ili smanjenja.

drugo, indikator koji se proučava može biti podložan cikličnim fluktuacijama. Ove fluktuacije mogu biti sezonske, jer aktivnosti brojnih privrednih i poljoprivrednih sektora zavise od doba godine. Ako su velike količine podataka dostupne tokom dugih vremenskih perioda, moguće je identificirati ciklične fluktuacije povezane s ukupnom dinamikom vremenske serije.

Neke vremenske serije ne sadrže trend ili cikličku komponentu, a svaki sljedeći nivo se formira kao zbir prosječnog nivoa serije i neke (pozitivne ili negativne) slučajne komponente.

U većini slučajeva, stvarni nivo vremenske serije može se predstaviti kao zbir ili proizvod trenda, cikličkih i slučajnih komponenti. Naziva se model u kojem je vremenska serija predstavljena kao zbir navedenih komponenti aditivni model vremenske serije. Naziva se model u kojem se vremenska serija predstavlja kao proizvod navedenih komponenti multiplikativni model vremenske serije. Glavni zadatak statističke studije pojedinačne vremenske serije je da identifikuje i kvantificira svaku od gore navedenih komponenti kako bi se dobivene informacije koristile za predviđanje budućih vrijednosti serije.

1.2 Autokorelacija nivoa vremenske serije i identifikacija njene strukture

Ako postoji trend i ciklične fluktuacije u vremenskoj seriji, vrijednosti svakog sljedećeg nivoa serije zavise od prethodnih. Korelaciona zavisnost između uzastopnih nivoa vremenske serije naziva se autokorelacija nivoa serije.

Može se kvantitativno mjeriti korištenjem koeficijenta linearne korelacije između nivoa originalne vremenske serije i nivoa ove serije pomjerenih za nekoliko koraka u vremenu.

Jedna od radnih formula za izračunavanje koeficijenta autokorelacije je:

(1.2.1)

Kao promenljivu x, smatraćemo niz y 2, y 3, ..., y n; kao varijabla y – serija y 1, y 2, . . . ,y n – 1 . Tada će gornja formula poprimiti oblik:

(1.2.2)

Slično, mogu se odrediti koeficijenti autokorelacije drugog i višeg reda. Dakle, koeficijent autokorelacije drugog reda karakteriše bliskost veze između nivoa y t i y t – 1 i određen je formulom

(1.2.3)

Poziva se broj perioda za koje se izračunava koeficijent autokorelacije lagom. Kako se kašnjenje povećava, smanjuje se broj parova vrijednosti iz kojih se izračunava koeficijent autokorelacije. Neki autori smatraju da je preporučljivo koristiti pravilo kako bi se osigurala statistička pouzdanost koeficijenata autokorelacije – maksimalno zaostajanje ne bi trebalo biti veće od (n/4).

Povratak

×
Pridružite se zajednici “koon.ru”!
U kontaktu sa:
Već sam pretplaćen na zajednicu “koon.ru”