Flytte Gjennomsnittet Sesong Variant
Flytte gjennomsnitt. Hvis denne informasjonen er tegnet på en graf, ser det ut til dette. Dette viser at det er stor variasjon i antall besøkende, avhengig av sesongen. Det er langt mindre om høsten og vinteren enn vår og sommer. hvis vi ønsket å se en trend i antall besøkende, kunne vi beregne et 4-punkts glidende gjennomsnitt. Vi gjør dette ved å finne gjennomsnittlig antall besøkende i fire kvartaler i 2005.Then finner vi gjennomsnittlig antall besøkende i siste tre fjerdedeler av 2005 og første kvartal 2006. Så de siste to kvartaler i 2005 og de to første kvartalene av 2006. Merk at det siste gjennomsnittet vi finner er de siste to kvartaler i 2006 og de to første kvartalene av 2007. Vi plotter de bevegelige gjennomsnittene på en graf, og sørger for at hvert gjennomsnitt er plottet i midten av de fire kvartene det dekker. Vi kan nå se at det er en svært liten nedadgående trend i besøkende. Spredning av implementering av sesongjustering og eksponensiell utjevning. Det er straightf orward for å utføre sesongjustering og passe eksponentielle utjevningsmodeller ved hjelp av Excel Skjermbilder og diagrammer nedenfor er hentet fra et regneark som er satt opp for å illustrere multiplikativ sesongjustering og lineær eksponensiell utjevning på følgende kvartalsvise salgsdata fra Outboard Marine. For å få en kopi av regnearkfilen selv, klikk her Versjonen av lineær eksponensiell utjevning som vil bli brukt her for demonstrasjonsformål, er Brown s-versjonen, bare fordi den kan implementeres med en enkelt kolonne med formler og det er bare én utjevningskonstant for å optimalisere Vanligvis er det bedre å bruke Holt s versjon som har separate utjevningskonstanter for nivå og trend. Forutsigelsesprosessen fortsetter som følger. Først blir dataene sesongjustert ii, da blir prognoser generert for sesongjusterte data via lineær eksponensiell utjevning og iii endelig sesongjusterte prognoser er resesasonalized for å få prognoser for origi nal-serien Sesongjusteringsprosessen utføres i kolonne D til G. Det første trinnet i sesongjustering er å beregne et sentrert glidende gjennomsnitt som utføres her i kolonne D Dette kan gjøres ved å ta gjennomsnittet av to års gjennomsnitt som kompenseres av en periode i forhold til hverandre. En kombinasjon av to offset-gjennomsnitt i stedet for et enkelt gjennomsnitt er nødvendig for sentreringsformål når antall sesonger er like. Det neste trinnet er å beregne forholdet til glidende gjennomsnitt - de opprinnelige dataene er delt av det bevegelige gjennomsnittet i hver periode - som utføres her i kolonne E Dette kalles også trend-syklus-komponenten i mønsteret, forutsatt at trend og konjunktursykluser kan anses å være alt som gjenstår etter gjennomsnitt over en helhet Års verdi av data Selvfølgelig kan endringer i måned til måned som ikke skyldes sesongbestemte, bestemmes av mange andre faktorer, men gjennomsnittet på 12 måneder glatter over dem i stor grad. Den estimerte sesongbestemte inde x for hver sesong beregnes ved først å beregne alle forholdene for den aktuelle sesongen, som gjøres i celler G3-G6 ved hjelp av en AVERAGEIF-formel. Gjennomsnittskvotene blir deretter rescaled slik at de summerer til nøyaktig 100 ganger antall perioder i en sesong , eller 400 i dette tilfellet, som er gjort i celler H3-H6 Nedenfor i kolonne F, brukes VLOOKUP formler til å sette inn riktig sesongindeksverdi i hver rad av datatabellen, i henhold til kvartalet av året representerer den Sentrert glidende gjennomsnitt og sesongjusterte data ser ut som dette. Merk at det bevegelige gjennomsnittet vanligvis ser ut som en jevnere versjon av den sesongjusterte serien, og den er kortere i begge endene. Et annet regneark i samme Excel-fil viser anvendelsen av lineær eksponensiell utjevningsmodell til sesongjusterte data, som begynner i kolonne GA-verdi for utjevningskonstanten alfa, er angitt over prognosen kolonnen her, i celle H9 og for enkelhets skyld blir det tildelt løpingen ge navn Alpha Navnet er tilordnet ved å bruke kommandoen Sett inn navnnavn LES-modellen er initialisert ved å sette de to første prognosene tilsvarer den første virkelige verdien av sesongjusterte seriene. Formelen som brukes her for LES-prognosen, er rekursiv form av Brown s-modellen. Denne formelen er oppgitt i cellen som svarer til den tredje perioden her, celle H15 og kopiert ned derfra Legg merke til at LES-prognosen for den nåværende perioden refererer til de to foregående observasjonene og de to foregående prognosefeilene om verdien av alpha Således refererer prognoseformelen i rad 15 kun til data som var tilgjengelige i rad 14 og tidligere. Selvfølgelig, hvis vi ønsket å bruke enkle i stedet for lineær eksponensiell utjevning, kunne vi erstatte SES-formelen her i stedet Vi kan også bruke Holt s snarere enn Brown s LES-modellen, som ville kreve to flere kolonner med formler for å beregne nivået og trenden som brukes i prognosen. Feilene beregnes i den neste kolonnen her, kolonne J ved å trekke prognosene fra de faktiske verdiene Rutenes gjennomsnittlige kvadratfeil beregnes som kvadratroten av feilenes varians pluss kvadratet av gjennomsnittet Dette følger av den matematiske identiteten MSE VARIANCE feil AVERAGE feil 2 Ved beregning av gjennomsnittet og variansen av feilene i denne formelen, er de to første periodene utelukket fordi modellen ikke faktisk begynner prognostisering til tredje periode rad 15 på regnearket. Den optimale verdien av alfa kan bli funnet enten ved å endre alfa manuelt til det minste RMSE er funnet, ellers kan du bruke Solver til å utføre en eksakt minimering. Verdien av alfa som Solver funnet er vist her alpha 0 471. Det er vanligvis en god ide å plotte feilen til modellen i transformerte enheter og også å beregne og plotte sine autokorrelasjoner ved lags på opptil en sesong. Her er en tidsserier av de sesongjusterte feilene. Feilautokorrelasjonene beregnes ved å bruke CORREL-funksjonen for å beregne korrelasjonene til feilene med seg selv forsinket av en eller flere perioder - detaljer vises i regnearkmodellen Her er et plott av autokorrelasjonene av feilene ved de første fem lagene. Autokorrelasjonene ved lags 1 til 3 er svært nær null, men spissen ved lag 4 hvis verdi er 0 35 er litt plagsom - det antyder at sesongjusteringsprosessen ikke har vært helt vellykket. Det er imidlertid bare marginalt signifikant 95 signifikansbånd for å teste om autokorrelasjoner er signifikant forskjellig fra null er omtrent pluss-eller-minus 2 SQRT nk, hvor n er prøvestørrelsen og k er lagdet. Her er n 38 og k varierer fra 1 til 5, slik at kvadrat-rot-av-n-minus-k er rundt 6 for dem alle, og derfor er grensene for å teste den statistiske signifikansen av avvik fra null, omtrent pluss-eller-minus 2 6 eller 0 33 Hvis du varierer verdien av alpha for hånd i denne Excel-modellen, kan du observere effekten på tidsseriene og autocorrelation plott av feilene, samt på den roten-middel-kvadratiske feilen, som vil bli illustrert nedenfor. På bunnen av regnearket blir prognoseformelen oppstartet inn i fremtiden ved bare å erstatte prognoser for faktiske verdier ved punktet hvor de faktiske dataene går ut - dvs. hvor fremtiden begynner Med andre ord, i hver celle der en fremtidig dataværdi vil oppstå, settes en cellereferanse som peker på prognosen for den perioden Alle de andre formlene kopieres rett og slett ned fra ovenfor. Merk at feilene for fremtidsutsikter alle er beregnet til å være null Dette betyr ikke at de faktiske feilene vil være null, men det reflekterer bare det faktum at vi forutsetter at fremtidige data vil være like gjennomsnittlig prognose De resulterende LES-prognosene for de sesongjusterte dataene ser slik ut. Med denne spesielle verdien av alfa, som er optimal for prognoser med en periode, er den prognostiserte trenden slett tly oppover, noe som gjenspeiler den lokale trenden som ble observert de siste 2 årene eller så. For andre verdier av alfa, kan det oppnås en helt annen trendprojeksjon. Det er vanligvis en god ide å se hva som skjer med den langsiktige trendprojeksjonen når alfa er variert, fordi verdien som er best for kortsiktig prognose, ikke nødvendigvis vil være den beste verdien for å forutse den lengre fremtid. For eksempel er her resultatet som oppnås hvis verdien av alfa er manuelt satt til 0 25. prognostisert langsiktig trend er nå negativ, heller enn positiv. Med en mindre verdi av alfa, legger modellen vekt på eldre data i sin estimering av dagens nivå og trend, og langsiktige prognosene reflekterer den nedadgående trenden observert over siste 5 årene i stedet for den nyere oppadgående trenden. Dette diagrammet illustrerer også tydelig hvordan modellen med en mindre verdi av alfa er langsommere for å svare på vendepunkter i dataene og derfor har en tendens til å gjøre en feil av de samme s ignorerer i mange perioder på rad. De 1-trinns prognosefeilene er større i gjennomsnitt enn de som er oppnådd før RMSE på 34 4 i stedet for 27 4 og sterkt positivt autokorrelert. Lag-1 autokorrelasjonen på 0 56 overstiger i stor grad verdien av 0 33 beregnet ovenfor for en statistisk signifikant avvik fra null Som et alternativ til å svekke verdien av alpha for å introdusere mer konservatisme i langsiktige prognoser, blir det noen ganger lagt en trend-dempningsfaktor til modellen for å gjøre den projiserte trenden flatt ut etter noen få tidsperioder. Det siste trinnet i å bygge prognosemodellen er å redealisere LES-prognosene ved å multiplisere dem med de riktige sesongbestemte indeksene. De resesasonaliserte prognosene i kolonne I er derfor bare produktene av sesongindeksene i kolonne F og sesongjustert LES-prognoser i kolonne H. Det er relativt enkelt å beregne konfidensintervaller for en-trinns prognoser laget av denne modellen først beregne RMSE root-mean - kvadratfeil, som bare er kvadratroten til MSE, og deretter beregne et konfidensintervall for sesongjustert prognose ved å legge til og trekke to ganger RMSE Generelt er et 95 konfidensintervall for en prognose for en periode frem til omtrent den samme som poeng prognose pluss-eller-minus-to ganger estimert standardavvik for prognosefeilene, forutsatt at feilfordelingen er omtrent normal og prøven er stor nok, si 20 eller mer her, RMSE i stedet for prøve standardavviket av feilene er det beste estimatet av standardavviket til fremtidige prognosefeil fordi det også tar hensyn til tilfeldige variasjoner. Tillitsgrensene for den sesongjusterte prognosen blir deretter resesasonalized sammen med prognosen, ved å multiplisere dem med de riktige sesongindeksene. I dette tilfelle RMSE er lik 27 4 og sesongjustert prognose for den første fremtidige perioden desember 93 er 273 2, slik at sesongjustert 95 confide nce intervallet er fra 273 2-2 27 4 218 4 til 273 2 2 27 4 328 0 Multiplisere disse grensene innen desember s sesongindeks på 68 61 vi oppnår lavere og øvre konfidensgrenser på 149 8 og 225 0 rundt 93-dec-punktet prognose på 187 4. Forsigelsesgrenser for prognoser mer enn en periode framover vil generelt bli større etter hvert som prognosehorisonten øker på grunn av usikkerhet om nivå og trend, samt sesongfaktorer, men det er vanskelig å beregne dem generelt ved hjelp av analytiske metoder Den riktige måten å beregne konfidensgrenser for LES-prognosen er ved å bruke ARIMA-teorien, men usikkerheten i sesongindeksene er en annen sak. Hvis du vil ha et realistisk konfidensintervall for en prognose mer enn en periode framover, tar du hensyn til alle feilkilder , din beste innsats er å bruke empiriske metoder for eksempel for å oppnå et konfidensintervall for en 2-trinns prognose, kan du opprette en annen kolonne på regnearket for å beregne en 2-trinns prognose for hver periode med b beregne RMSE-prognosen for 2-trinns prognosefeil, og bruk dette som grunnlag for et 2-trinns konfidensintervall. Gjennomsnittlig gjennomsnitt. Måling av tidsseriedataobservasjoner like fordelt i tid fra flere sammenhengende perioder Kalt flytting fordi det kontinuerlig rekomputeres når nye data blir tilgjengelige, går det fram ved å slippe den tidligste verdien og legge til den nyeste verdien. For eksempel kan det bevegelige gjennomsnittet på seks måneders salg beregnes ved å ta gjennomsnittet av salget fra Januar til juni, så gjennomsnittet av salget fra februar til juli, deretter mars til august, osv. Flytte gjennomsnitt 1 redusere effekten av midlertidige variasjoner i data, 2 forbedre passformen til en linje en prosess som kalles utjevning for å vise dataene trender tydeligere og 3 markerer verdi over eller under trenden. Hvis du beregner noe med svært høy varians, er det best du kan gjøre å finne ut det bevegelige gjennomsnittet. Jeg ville vite hva Flytende gjennomsnitt var av dataene, så jeg ville få en bedre forståelse av hvordan vi gjorde. Når du prøver å finne ut noen tall som endrer seg ofte, er det beste du kan gjøre å beregne det bevegelige gjennomsnittet. Boks Jenkins B-J-modeller.
Comments
Post a Comment