Techniki regresji liniowej do poruszania się średnie i wygładzające


Prognozowanie przez wygładzanie technik Ta strona jest częścią elektronicznych obiektów E-learning, służących do podejmowania decyzji. Inne JavaScript w tej serii są podzielone na kategorie w różnych obszarach aplikacji w sekcji MENU na tej stronie. Szereg czasowy to sekwencja obserwacji uporządkowanych w czasie. Nieodłącznym elementem zbierania danych zebranych w czasie jest pewna forma losowej zmienności. Istnieją metody zmniejszania anulowania efektu z powodu zmienności losowej. Szeroko stosowane techniki wygładzają. Techniki te, gdy są odpowiednio stosowane, ujawniają bardziej wyraźne tendencje. Wprowadź serie czasowe w kolejności wierszowej, zaczynając od lewego górnego rogu i parametru (ów), a następnie kliknij przycisk Oblicz, aby uzyskać prognozowanie z wyprzedzeniem jednokresowym. Puste pola nie są uwzględniane w obliczeniach, ale zera są. Podczas wprowadzania danych do przenoszenia z komórki do komórki w macierzy danych użyj klawisza Tab, a nie strzałki lub wprowadź klucze. Funkcje szeregów czasowych, które mogą zostać ujawnione poprzez sprawdzenie jego wykresu. z prognozowanymi wartościami, zachowaniem resztkowym, modelowaniem prognoz stanu. Średnie kroczące: średnia ruchoma zaliczana jest do najpopularniejszych technik preprocesowania szeregów czasowych. Służą one do filtrowania losowego białego szumu z danych, aby szereg czasowy był bardziej płynny, a nawet aby uwydatnić niektóre informacyjne elementy zawarte w szeregach czasowych. Exponential Smoothing: Jest to bardzo popularny schemat generowania wygładzonej serii czasowej. Podczas gdy w średnich kroczących poprzednie obserwacje są równomiernie ważone, wykładnicze wygładzanie przypisuje wykładniczo malejące ciężary, gdy obserwacja staje się starsza. Innymi słowy, niedawne obserwacje są relatywnie większe w prognozowaniu niż starsze obserwacje. Double Exponential Smoothing lepiej radzi sobie z trendami. Triple Exponential Smoothing lepiej sprawdza trendy paraboli. Średnia ważona średnią ruchoma z wycentrowaną prędkością a. odpowiada w przybliżeniu prostej średniej kroczącej długości (to jest kropki) n, gdzie a oraz n są powiązane przez: a 2 (n1) OR n (2 - a) a. Tak więc, na przykład, średnia ważona średnią ruchoma ze stałą wygładzania równą 0,1 odpowiadaby w przybliżeniu 19-dniowej średniej ruchomej. I 40-dniowa prosta średnia ruchoma odpowiadałaby przybliżonej średniej ruchomej z wykładziną wykładaną ze stałą wygładzania równą 0,04878. Holts Linear Exponential smoothening: Załóżmy, że serie czasów są nie sezonowe, ale mają tendencję do wyświetlania. Metoda Holts szacuje zarówno bieżący poziom, jak i aktualny trend. Zauważ, że prosta średnia ruchoma jest szczególnym przypadkiem wygładzania wykładniczego, ustawiając okres średniej ruchomej na całkowitą część (2-alfa) alfa. W przypadku większości danych biznesowych często skuteczny jest parametr Alfa mniejszy niż 0,40. Można jednak wykonać przeszukiwanie siatki przestrzeni parametrów, od 0,1 do 0,9, ze skokiem 0,1. Następnie najlepsza alfa ma najmniejszy średni błąd bezwzględny (MA Error). Jak porównać kilka metod wygładzania: Chociaż istnieją wskaźniki liczbowe do oceny dokładności techniki prognozowania, najszerzej stosuje się porównanie wizualne kilku prognoz w celu oceny ich dokładności i wyboru spośród różnych metod prognozowania. W tym podejściu należy wykreślić (na przykład na Excelze) na tym samym wykresie oryginalne wartości zmiennej z serii czasowej i prognozowane wartości z kilku różnych metod prognozowania, co ułatwia porównanie wizualne. Możesz skorzystać z wcześniejszych prognoz za pomocą wygładzania technik JavaScript w celu uzyskania wcześniejszych wartości prognoz opartych na technikach wyrównywania, które używają tylko jednego parametru. Metody Holta i Wintersa stosują odpowiednio dwa i trzy parametry, dlatego nie jest łatwo wybrać optymalne, a nawet bliskie optymalne wartości próbne i błędy dla parametrów. Jednokierunkowe wygładzenie podkreśla perspektywę krótkiego zasięgu, wyznaczając poziom do ostatniej obserwacji i opiera się na warunku, że nie ma tendencji. Regresja liniowa, która pasuje do linii najmniejszych kwadratów do danych historycznych (lub przekształconych danych historycznych), reprezentuje długi dystans, który zależy od podstawowej tendencji. Holowanie liniowe wygładzanie wykładnicze przechwytuje informacje o aktualnym trendzie. Parametry w modelu Holts to parametr poziomów, który powinien zostać zmniejszony, gdy wielkość zmian danych jest duża, a parametr trendu powinien zostać zwiększony, jeśli ostatni trend będzie wspierany przez przyczyny. Prognozy krótkoterminowe: zauważ, że każdy skrypt JavaScript na tej stronie zapewnia prognozy jednoetapowe. Aby uzyskać prognozę dwuetapową. po prostu dodaj prognozowaną wartość na końcu serii danych czasowych, a następnie kliknij ten sam przycisk Oblicz. Możesz powtórzyć ten proces kilka razy, aby uzyskać potrzebne krótkoterminowe prognozy. Wygładzanie danych usuwa przypadkową zmienność i pokazuje trendy oraz cykliczne komponenty. Nieodłącznym elementem zbierania danych pobieranych w czasie jest pewna forma losowej zmienności. Istnieją metody zmniejszania anulowania efektu z powodu zmienności losowej. Wygładza się często stosowana w przemyśle technika. Technika ta, jeśli jest właściwie stosowana, ujawnia bardziej wyraźny trend, elementy sezonowe i cykliczne. Istnieją dwie różne grupy metod wygładzania Metody uśredniania Metody wyrównywania wykładniczego Wykonywanie średnich jest najprostszym sposobem na wygładzenie danych Najpierw zbadamy niektóre metody uśredniania, takie jak prosta średnia wszystkich przeszłych danych. Kierownik magazynu chce wiedzieć, ile typowy dostawca dostarcza w jednostkach 1000 dolarów. Heshe pobiera próbę z 12 dostawców, losowo, uzyskując następujące wyniki: średnia obliczona lub średnia danych 10. Kierownik decyduje się na wykorzystanie tego jako preliminarza wydatków typowego dostawcy. Czy to jest dobre czy złe oszacowanie Średni kwadrat błędu to sposób na ocenę, jak dobry jest model Obliczymy błąd średniokwadratowy. Błąd prawdziwej kwoty wydanej minus szacowana kwota. Błękitny kwadrat jest błędem powyżej, wyrównany. SSE jest sumą kwadratowych błędów. MSE jest średnią z kwadratów błędów. Wyniki MSE na przykład Wyniki są następujące: Błędy i błędy kwadratowe Szacunek 10 Powstaje pytanie: czy możemy użyć średniej do prognozowania dochodu, jeśli podejrzewamy pewien trend. Spojrzenie na poniższy wykres pokazuje wyraźnie, że nie powinniśmy tego robić. Średnia w równym stopniu waży wszystkie poprzednie obserwacje Podsumowując, stwierdzamy, że Prosta średnia lub średnia ze wszystkich przeszłych obserwacji jest tylko użytecznym oszacowaniem dla prognozowania, gdy nie ma trendów. Jeśli istnieją trendy, użyj różnych szacunków, które uwzględniają trend. Średnia waży wszystkie obserwacje w równym stopniu. Na przykład średnia z wartości 3, 4, 5 wynosi 4. Wiemy oczywiście, że średnią oblicza się, dodając wszystkie wartości i dzieląc sumę przez liczbę wartości. Innym sposobem obliczania średniej jest dodanie każdej wartości podzielonej przez liczbę wartości, czyli 33 43 53 1 1.3333 1.6667 4. Mnożnik 13 nazywa się wagą. Ogólnie: bar frac suma w lewo (w prawo frac) x1 w lewo (frac w prawo) x2,. ,, w lewo (w prawo frac) xn. (Po lewej (po prawej stronie)) są wagami i, oczywiście, sumują się do 1.3. Zrozumienie poziomów i metod prognozowania Można wygenerować zarówno prognozy dotyczące szczegółów (pojedynczej pozycji), jak i podsumowania (linii produktów) odzwierciedlające wzorce popytu na produkty. System analizuje sprzedaż w przeszłości w celu obliczania prognoz przy użyciu 12 metod prognozowania. Prognozy zawierają szczegółowe informacje na poziomie pozycji i informacje o wyższym poziomie dotyczące oddziału lub firmy jako całości. 3.1 Prognoza wyników Kryteria W zależności od wyboru opcji przetwarzania oraz trendów i wzorców danych dotyczących sprzedaży, niektóre metody prognozowania osiągają lepsze wyniki niż dane dla danego zbioru danych historycznych. Metoda prognozowania odpowiednia dla jednego produktu może być nieodpowiednia dla innego produktu. Może się okazać, że metoda prognozowania, która zapewnia dobre wyniki na jednym etapie cyklu życia produktu, pozostaje odpowiednia w całym cyklu życia. Możesz wybrać jedną z dwóch metod, aby ocenić bieżącą wydajność metod prognozowania: procent dokładności (POA). Średnie absolutne odchylenie (MAD). Obie te metody oceny wydajności wymagają danych historycznych dotyczących sprzedaży dla określonego okresu. Ten okres nazywany jest okresem wstrzymania lub okresem najlepszego dopasowania. Dane w tym okresie są wykorzystywane jako podstawa do rekomendowania, która metoda prognozowania ma być wykorzystana do realizacji kolejnej prognozy prognozy. Rekomendacja jest specyficzna dla każdego produktu i może zmieniać się z jednego generowania prognozy na następny. 3.1.1 Best Fit System zaleca prognozę najlepszego dopasowania, stosując wybrane metody prognozowania do przeszłej historii zamówienia sprzedaży i porównując symulację prognozy z rzeczywistą historią. Kiedy wygenerujesz prognozę najlepszej dopasowania, system porównuje aktualne historie zleceń sprzedaży z prognozami dla określonego przedziału czasu i oblicza, jak dokładnie każda inna metoda prognozowania przewidywała sprzedaż. Następnie system zaleca najdokładniejsze prognozy jako najlepsze dopasowanie. Ta grafika ilustruje najlepsze dopasowania prognozy: Rysunek 3-1 Najlepsza prognoza dopasowania System wykorzystuje tę sekwencję kroków do określenia najlepszego dopasowania: Użyj każdej określonej metody, aby zasymulować prognozę okresu wstrzymania. Porównać rzeczywistą sprzedaż z symulowanymi prognozami w okresie utrzymywania. Oblicz POA lub MAD, aby określić, która metoda prognozowania najbardziej pasuje do poprzedniej rzeczywistej sprzedaży. System korzysta z POA lub MAD, w oparciu o wybrane opcje przetwarzania. Poleć najlepszą prognozę POA, która jest najbliższa 100% (ponad lub poniżej) lub MAD, która jest najbliższa zeru. 3.2 Metody prognozowania JD Edwards EnterpriseOne Forecast Management wykorzystuje 12 metod do prognozowania ilościowego i wskazuje, która metoda najlepiej pasuje do sytuacji prognostycznej. W tej sekcji omówiono: Metoda 1: Procent w ciągu ostatniego roku. Metoda 2: Obliczona wartość procentowa w stosunku do ostatniego roku. Metoda 3: Ostatni rok w tym roku. Metoda 4: Średnia ruchoma. Metoda 5: Zbliżenie liniowe. Metoda 6: Regresja najmniejszych kwadratów. Metoda 7: aproksymacja drugiego stopnia. Metoda 8: Metoda elastyczna. Metoda 9: Średnia ważona ruchoma. Metoda 10: Wygładzanie liniowe. Metoda 11: wyrównywanie wykładnicze. Metoda 12: Wyrównywanie wykładnicze z tendencją i sezonowością. Określ metodę, której chcesz użyć w opcjach przetwarzania programu Forecast Generation (R34650). Większość tych metod zapewnia ograniczoną kontrolę. Na przykład waga umieszczona na ostatnich danych historycznych lub w zakresie dat danych historycznych wykorzystywanych w obliczeniach może zostać określona przez Ciebie. Przykłady w przewodniku wskazują procedurę obliczania dla każdego z dostępnych metod prognozowania, biorąc pod uwagę identyczny zestaw danych historycznych. Przykłady metod w podręczniku wykorzystują część lub wszystkie te zbiory danych, które są historycznymi danymi z ostatnich dwóch lat. Prognoza przewiduje się w przyszłym roku. Te dane z historii sprzedaży są stabilne, przy niewielkich sezonowych wzrostach w lipcu i grudniu. Ten wzorzec jest charakterystyczny dla dojrzałego produktu, który może zbliżać się do starzenia się. 3.2.1 Metoda 1: Procent w porównaniu z poprzednim rokiem Metoda ta wykorzystuje wzorcowanie Procent powyżej ubiegłego roku do pomnożenia każdego okresu prognozy o określony procentowy wzrost lub spadek. Aby prognozować zapotrzebowanie, metoda ta wymaga liczby okresów najlepiej dopasowanych oraz jednego roku sprzedaży. Metoda ta jest przydatna do prognozowania popytu na artykuły sezonowe ze wzrostem lub spadkiem. 3.2.1.1 Przykład: Metoda 1: Procent w porównaniu z rokiem ubiegłym Procent w stosunku do ostatniego roku wzbogaca dane z poprzedniego roku o określony przez Ciebie czynnik, a następnie projekt, który nastąpił w ciągu następnego roku. Ta metoda może być przydatna w budżetowaniu do symulacji wpływu określonej stopy wzrostu lub gdy historia sprzedaży ma znaczący składnik sezonowy. Specyfikacja prognozy: Mnożnik. Na przykład, wybierz opcję 110 w opcji przetwarzania, aby zwiększyć dane historii sprzedaży z poprzedniego roku o 10 procent. Wymagana historia sprzedaży: jeden rok na obliczenie prognozy oraz liczba okresów czasu wymaganych do oceny prognozowanej skuteczności (okresy najlepszego dopasowania), które określasz. Tabela ta jest historią wykorzystywaną w obliczeniach prognozy: prognoza lutowa wynosi 117 razy 1.1 128,7 zaokrąglona do 129. Prognoza marcowa wynosi 115 razy 1.1 126,5 zaokrąglona do 127. 3.2.2 Metoda 2: Obliczony procent w ciągu ostatniego roku Ta metoda używa obliczonego procentu ponad Formuła zeszłoroczna, aby porównać wcześniejszą sprzedaż określonych okresów ze sprzedażą z tych samych okresów roku poprzedniego. System określa procentowy wzrost lub spadek, a następnie mnoży każdy okres przez procent w celu określenia prognozy. Aby przewidzieć popyt, ta metoda wymaga liczby okresów historii zamówień sprzedaży plus jeden rok historii sprzedaży. Ta metoda jest przydatna do prognozowania krótkoterminowego popytu na produkty sezonowe ze wzrostem lub spadkiem. 3.2.2.1 Przykład: Metoda 2: Obliczony procent w ciągu ostatniego roku Formuła wyliczenia procentowego w ubiegłym roku mnoży dane dotyczące sprzedaży z poprzedniego roku przez czynnik obliczany przez system, a następnie projektuje ten wynik na następny rok. Ta metoda może być przydatna w prognozowaniu wpływu przedłużenia ostatniego wzrostu stopy produktu na następny rok przy zachowaniu sezonowości, która jest obecna w historii sprzedaży. Specyfikacja prognozy: zakres historii sprzedaży do wykorzystania przy obliczaniu tempa wzrostu. Na przykład, określ liczbę n równą 4 w opcji przetwarzania, aby porównać historię sprzedaży za ostatnie cztery okresy z tymi samymi czterema okresami roku ubiegłego. Użyj obliczonego współczynnika, aby wykonać projekcję na następny rok. Wymagana historia sprzedaży: rok do obliczenia prognozy plus liczba okresów potrzebnych do oceny prognozy (okresy najlepiej dopasowane). Ta tabela jest historią wykorzystywaną w prognozowaniu obliczeń, biorąc pod uwagę: n 4: prognoza lutowa wynosi 117 razy 0,9766 114,26 zaokrąglona do 114. prognoza marcowa wynosi 115 razy 0,9766 112,31 zaokrąglona do 112. 3.2.3 Metoda 3: Ostatni rok do tego roku Ta metoda wykorzystuje ostatnie lata sprzedaży na najbliższe lata prognozy. Aby przewidzieć popyt, ta metoda wymaga liczby najlepiej pasujących okresów plus jeden rok historii zamówień sprzedaży. Ta metoda jest przydatna do prognozowania popytu na starsze produkty o popycie na poziomie lub popytu sezonowego bez tendencji. 3.2.3.1 Przykład: Metoda 3: Ostatni rok w tym roku Formuła Ostatni rok w tym roku kopiuje dane sprzedaży z poprzedniego roku na następny rok. Ta metoda może być użyteczna w budżetowaniu, aby symulować sprzedaż na obecnym poziomie. Produkt jest dojrzały i nie ma trendu w dłuższej perspektywie, ale może występować znaczny sezonowy wzór zapotrzebowania. Specyfikacja prognozy: brak. Wymagana historia sprzedaży: rok do obliczenia prognozy plus liczba okresów potrzebnych do oceny prognozy (okresy najlepiej dopasowane). Tabela ta jest historią wykorzystywaną w obliczeniach prognozy: prognoza styczniowa to styczeń zeszłego roku z wartością prognozowaną na poziomie 128. Prognoza w lutym jest równa lutowi ubiegłego roku z prognozą 117. Prognoza marcowa to marzec ubiegłego roku z prognozą 115. 3.2.4 Metoda 4: Średnia krocząca Ta metoda wykorzystuje średnią ruchomą do wyliczenia określonej liczby okresów do wyświetlenia w następnym okresie. Powinieneś raz jeszcze przeliczać (co miesiąc lub przynajmniej kwartalnie), aby odzwierciedlić zmieniający się poziom popytu. Aby przewidzieć popyt, ta metoda wymaga liczby najlepiej pasujących okresów oraz liczby okresów historii zamówień sprzedaży. Ta metoda jest przydatna do prognozowania popytu na dojrzałe produkty bez tendencji. 3.2.4.1 Przykład: Metoda 4: Średnia średnia ruchoma (Moving Average Moving Average - MA) jest popularną metodą uśredniania wyników ostatniej historii sprzedaży w celu określenia projekcji w perspektywie krótkoterminowej. Metoda prognozowania MA jest opóźniona. Prognozowanie tendencji i błędów systematycznych pojawiają się, gdy historia sprzedaży produktów wykazuje silny trend lub sezonowe wzorce. Ta metoda sprawdza się lepiej w prognozach krótkiego zasięgu produktów dojrzałych niż w przypadku produktów, które są w fazie wzrostu lub starzenia się w cyklu życia. Specyfikacje prognozy: n jest równy liczbie okresów historii sprzedaży, które mają zostać użyte do obliczenia prognozy. Na przykład, określ n 4 w opcji przetwarzania, aby użyć ostatnich czterech okresów jako podstawy dla projekcji do następnego okresu czasu. Duża wartość n (np. 12) wymaga większej historii sprzedaży. Prowadzi to do stabilnej prognozy, ale powoli zauważa zmiany poziomu sprzedaży. Z drugiej strony mała wartość n (np. 3) jest szybsza w odpowiedzi na zmiany poziomu sprzedaży, ale prognoza może wahać się tak bardzo, że produkcja nie może reagować na zmiany. Wymagana historia sprzedaży: n plus liczba okresów czasu wymaganych do oceny prognozy (okresy najlepszego dopasowania). Tabela ta jest historią stosowaną w obliczeniach prognozy: prognoza lutowa jest równa (114 119 137 125) 4 123,75 zaokrąglona do 124. Prognoza marcowa jest równa (119 137 125 124) 4 126,25 zaokrąglona do 126. 3.2.5 Metoda 5: Liniowe przybliżenie Ta metoda wykorzystuje formułę Liniową aproksymację do obliczenia trendu z liczby okresów historii zamówień sprzedaży i do projekcji tego trendu do prognozy. Powinieneś ponownie obliczyć tę tendencję w celu wykrycia zmian trendów. Metoda ta wymaga liczby okresów najlepiej dopasowanych oraz liczby określonych okresów historii zamówień. Ta metoda jest przydatna do prognozowania popytu na nowe produkty lub produkty o stałych, pozytywnych lub negatywnych tendencjach, które nie są związane z wahaniami sezonowymi. 3.2.5.1 Przykład: Metoda 5: Przybliżenie liniowe Zbliżenie liniowe oblicza trend, który oparty jest na dwóch punktach historii historii sprzedaży. Te dwa punkty definiują prostą linię trendu przewidzianą w przyszłości. Tej metody należy używać ostrożnie, ponieważ prognozy dotyczące dalekiego zasięgu są wykorzystywane przez małe zmiany w zaledwie dwóch punktach danych. Specyfikacja prognozy: n oznacza punkt danych w historii sprzedaży porównywany z najnowszym punktem danych w celu zidentyfikowania tendencji. Na przykład podaj n 4, aby wykorzystać różnicę między grudniem (najświeższe dane) a sierpniem (cztery okresy przed grudniem) jako podstawę obliczania trendu. Minimalna wymagana historia sprzedaży: n plus 1 plus liczba okresów czasu wymaganych do oceny prognozy (okresy najlepszego dopasowania). Tabela ta jest historią wykorzystywaną w kalkulacji prognoz: prognoza styczniowa Grudzień z ubiegłego roku 1 (Trend), która wynosi 137 (1 razy 2) 139. Prognoza z lutego: grudzień ubiegłego roku 1 (Trend), który wynosi 137 (2 razy 2) 141. Prognoza marcowa grudzień poprzedniego roku 1 (Trend), która wynosi 137 (3 razy 2) 143. 3.2.6 Metoda 6: Regresja najmniejszych kwadratów Metoda regresji najmniejszych kwadratów (LSR) wyprowadza równanie opisujące liniową zależność między historycznymi danymi sprzedaży i upływ czasu. LSR dopasowuje linię do wybranego zakresu danych, tak aby zminimalizować sumę kwadratów różnic pomiędzy rzeczywistymi punktami danych sprzedaży i linią regresji. Prognoza jest rzutem tej prostej w przyszłość. Ta metoda wymaga historii danych sprzedaży dla okresu, który jest reprezentowany przez liczbę najlepiej dopasowanych okresów plus określoną liczbę okresów danych historycznych. Minimalnym wymogiem są dwa historyczne punkty danych. Ta metoda jest użyteczna do prognozowania zapotrzebowania, gdy w danych są liniowy trend. 3.2.6.1 Przykład: Metoda 6: Regresja najmniejszych kwadratów Regresja liniowa lub Regresja najniższych kwadratów (LSR) są najpopularniejszą metodą identyfikacji liniowego trendu w danych historycznych sprzedaży. Metoda oblicza wartości dla a i b, które mają być użyte w formule: To równanie przedstawia linię prostą, gdzie Y reprezentuje sprzedaż, a X oznacza czas. Regresja liniowa powoli rozpoznaje punkty zwrotne, a funkcje kroku zmieniają popyt. Regresja liniowa dopasowuje linię prostą do danych, nawet jeśli dane są sezonowe lub lepiej opisane przez krzywą. Gdy dane o historii sprzedaży są zgodne z krzywą lub mają silny sezonowy wzór, przewidywane tendencje i błędy systematyczne. Specyfikacja prognozy: n równa się okresom historii sprzedaży, które będą używane przy obliczaniu wartości a i b. Na przykład, określ n 4, aby wykorzystać historię od września do grudnia jako podstawę do obliczeń. Gdy dane są dostępne, zwykle używane jest większe n (na przykład n 24). LSR definiuje linię dla zaledwie dwóch punktów danych. W tym przykładzie wybrano małą wartość n (n 4) w celu zmniejszenia ręcznych obliczeń wymaganych do zweryfikowania wyników. Minimalna wymagana historia sprzedaży: n okresów plus liczba okresów wymaganych do oceny prognozy (okresy najlepszego dopasowania). Ta tabela jest używana w obliczeniach prognozy: prognoza marcowa wynosi 119,5 (7 razy 2,3) 135,6 zaokrąglona do 136. 3.2.7 Metoda 7: Aproksymacja drugiego stopnia Aby zaprojektować prognozę, ta metoda wykorzystuje formułę aproksymacji drugiego stopnia do wykreślenia krzywej która opiera się na liczbie okresów sprzedaży. Ta metoda wymaga lepszego dopasowania liczby okresów oraz liczby okresów historii zamówień sprzedaży w trzech. Ta metoda nie jest przydatna do prognozowania popytu na dłuższy okres. 3.2.7.1 Przykład: Metoda 7: Przybliżenie drugiego stopnia Regresja liniowa określa wartości dla a i b w projekcie prognozy Y a b X w celu dopasowania prostej linii do danych historii sprzedaży. Podejście drugiego stopnia jest podobne, ale ta metoda określa wartości dla a, b i c w tej prognozowanej formule: Y a b X c X 2 Celem tej metody jest dopasowanie krzywej do historii historii sprzedaży. Ta metoda jest użyteczna, gdy produkt znajduje się w fazie przejściowej pomiędzy etapami cyklu życia. Na przykład, gdy nowy produkt przechodzi od etapu wprowadzania do etapu wzrostu, tendencja sprzedaży może przyspieszyć. Z powodu drugiego rzędu, prognoza może szybko podchodzić do nieskończoności lub spada do zera (w zależności od tego, czy współczynnik c jest dodatni czy ujemny). Ta metoda jest przydatna tylko w krótkim okresie. Specyfikacje prognozy: formuła znaleźć a, b i c, aby dopasować krzywą dokładnie do trzech punktów. Określasz n, liczbę okresów czasu gromadzonych w każdym z trzech punktów. W tym przykładzie n 3. Aktualne dane dotyczące sprzedaży za okres od kwietnia do czerwca łączone są w pierwszy punkt, I kwartał. Od lipca do września dodaje się razem, aby utworzyć Q2, a od października do grudnia suma do trzeciego kwartału. Krzywa jest dopasowana do trzech wartości Q1, Q2 i Q3. Wymagana historia sprzedaży: 3 razy n okresów do obliczenia prognozy plus liczba okresów czasu wymaganych do oceny prognozy (okresy najlepszego dopasowania). Tabela ta jest historią wykorzystywaną w prognozowaniu: Q0 (Jan) (luty) (Mar) Q1 (kwiecień) (maj) (cze), który wynosi 125 122 137 384 Q2 (lipiec) (sierpień) (wrzesień), który wynosi 140 129 131 400 Q3 (październik) (listopad) (grudzień), który jest równy 114 119 137 370 Następny krok obejmuje obliczenie trzech współczynników a, b i c, które mają być użyte w formule prognozowania Y ab X c X 2. Q1, Q2 i Q3 są prezentowane na grafice, gdzie czas jest wykreślony na osi poziomej. Q1 reprezentuje całkowitą sprzedaż historyczną na kwiecień, maj i czerwiec i jest narysowany w X 1 Q2 od lipca do września 3 kwartału od października do grudnia, a czwarty kwartał od stycznia do marca. Ta grafika ilustruje wykreślanie Q1, Q2, Q3 i Q4 dla aproksymacji drugiego stopnia: Rysunek 3-2 Plotowanie Q1, Q2, Q3 i Q4 dla aproksymacji drugiego stopnia Trzy równania opisują trzy punkty na wykresie: (1) Q1 a bX cX 2 gdzie X 1 (Q1 abc) (2) Q2 a bX cX 2 gdzie X 2 (Q2 a 2b 4c) (3) Q3 a bX cX 2 gdzie X 3 (Q3 a 3b 9c) Rozwiąż te trzy równania jednocześnie aby znaleźć b, a, i c: Odejmij równanie 1 (1) z równania 2 (2) i rozwiąż dla b: (2) ndash (1) Q2 ndash Q1 b 3c b (Q2 ndash Q1) ndash 3c Zastąp to równanie dla b na równanie (3): (3) Q3 a 3 (Q2 ndash Q1) ndash 3c 9c a Q3 ndash 3 (Q2 ndash Q1) Na koniec, zamień te równania na a i b na równanie (1): (1) Q3 ndash 3 (Q2 ndash Q1) (Q2 ndash Q1) ndash 3c c Q1 c (Q3 ndash Q2) (Q1 ndash Q2) 2 Metoda drugiego stopnia aproksymacji oblicza a, b, c jak następuje: a Q3 ndash 3 (Q2 ndash Q1 ) 370 ndash 3 (400 ndash 384) 370 ndash 3 (16) 322 b (Q2 ndash Q1) ndash3c (400 ndash sh 384) ndash (3 razy ndash23) 16 69 85 c (Q3 ndash Q2) (Q1 ndash Q2) 2 (370 ndash 400) (384 ndash 400) 2 ndash23 Jest to obliczenie prognozy aproksymacji drugiego stopnia: Y a bX cX 2 322 85X (ndash23) (X 2) Gdy X 4, Q4 322 340 ndash 368 294. Prognoza wynosi 294 3 98 na okres. Kiedy X 5, Q5 322 425 ndash 575 172. Prognoza wynosi 172 3 58,33 zaokrąglona do 57 na okres. Gdy X 6, Q6 322 510 ndash 828 4. Prognoza wynosi 4 3 1,33 zaokrąglone do 1 na okres. Jest to prognoza na przyszły rok, Ostatni rok do tego roku: 3.2.8 Metoda 8: Elastyczna metoda Ta metoda umożliwia wybranie najlepszej liczby okresów historii zamówień sprzedaży, która rozpoczyna się n miesięcy przed prognozowaną datą rozpoczęcia, oraz zastosuj procentowy wzrost lub zmniejszenie współczynnika mnożnikowego, który ma zmodyfikować prognozę. Ta metoda jest podobna do metody 1, procent w ciągu ostatniego roku, z tą różnicą, że możesz określić liczbę okresów, których używasz jako podstawy. W zależności od tego, co wybierzesz jako n, metoda ta wymaga okresów najlepiej dopasowanych oraz liczby wskazanych okresów sprzedaży danych. Ta metoda jest przydatna do prognozowania zapotrzebowania na planowany trend. 3.2.8.1 Przykład: Metoda 8: Metoda elastyczna Metoda elastyczności (Procent powyżej n miesięcy poprzednich) jest podobna do metody 1, w procentach w zeszłym roku. Obie metody pomnożają dane o sprzedaży z poprzedniego okresu przez czynnik określony przez Ciebie, a następnie projektuj ten wynik w przyszłość. Procent oparty na ostatnim rocznym projekcji opiera się na danych z tego samego okresu w roku poprzednim. Metodę elastyczności można również użyć do określenia przedziału czasowego, innego niż ten sam okres w ubiegłym roku, do wykorzystania jako podstawy do obliczeń. Współczynnik mnożenia. Na przykład określ opcję 110 w opcji przetwarzania, aby zwiększyć poprzednie dane dotyczące historii sprzedaży o 10 procent. Okres bazowy. Na przykład n 4 powoduje, że pierwsza prognoza opiera się na danych o sprzedaży we wrześniu ubiegłego roku. Minimalna wymagana historia sprzedaży: liczba okresów do okresu bazowego plus liczba okresów czasu potrzebna do oceny prognozy (okresy najlepszego dopasowania). Tabela ta jest historią używaną w obliczeniach prognozy: 3.2.9 Metoda 9: ważona średnia ruchoma Ważona średnia ważona formuła jest podobna do metody 4, średnia ruchoma, ponieważ uśrednia historię sprzedaży z poprzednich miesięcy, aby wyświetlić historię sprzedaży w następnym miesiącu. Jednak dzięki tej formule można przypisać wagi dla każdego z poprzednich okresów. Metoda ta wymaga podania liczby waŜonych okresów oraz liczby okresów najlepiej pasujących do danych. Podobnie jak w przypadku średniej ruchomej, ta metoda pozostaje w tyle za trendami popytu, więc ta metoda nie jest zalecana w przypadku produktów o silnych tendencjach lub sezonowości. Ta metoda jest przydatna do prognozowania popytu na dojrzałe produkty o stosunkowo wysokim poziomie popytu. 3.2.9.1 Przykład: Metoda 9: Średnia ważona ruchoma Metoda ważona średnia ruchoma (WMA) jest podobna do metody 4, średnia ruchoma (MA). Jednak przy użyciu WMA można przypisać niejednakowe wagi do danych historycznych. Metoda oblicza średnią ważoną z ostatnich historii sprzedaży, aby osiągnąć prognozę na najbliższy okres. Nowszym danym zwykle przypisuje się większą wagę niż dane starsze, więc WMA bardziej odpowiada na zmiany w poziomie sprzedaży. Jednakże prognozowane nastawienia i błędy systematyczne występują, jeśli historia sprzedaży produktów wykazuje silne trendy lub sezonowe wzorce. Ta metoda sprawdza się lepiej w przypadku prognoz krótkiego zasięgu produktów dojrzałych niż produktów na etapie wzrostu lub starzenia się w cyklu życia. Liczba okresów historii sprzedaży (n) do wykorzystania w obliczeniach prognostycznych. Na przykład, określ n 4 w opcji przetwarzania, aby użyć ostatnich czterech okresów jako podstawy dla projekcji do następnego okresu czasu. Duża wartość dla n (na przykład 12) wymaga większej historii sprzedaży. Taka wartość skutkuje stabilną prognozą, ale powolne rozpoznawanie zmian w poziomie sprzedaży. Z drugiej strony mała wartość dla n (np. 3) reaguje szybciej na zmiany poziomu sprzedaży, ale prognoza może wahać się tak bardzo, że produkcja nie może odpowiadać na zmiany. Całkowita liczba okresów dla opcji przetwarzania rdquo14 - okresy obejmujące okres nie dłuższy niż 12 miesięcy. Masa przypisana do każdego z historycznych okresów danych. Przypisane wagi muszą wynosić 1,00. Na przykład, gdy n 4, przypisać wagi 0,50, 0,25, 0,15 i 0,10 z najnowszymi danymi otrzymującymi największą masę. Minimalna wymagana historia sprzedaży: n plus liczba okresów wymaganych do oceny prognozy (okresy najlepszego dopasowania). Ta tabela jest używana do obliczenia prognozy: prognoza styczniowa jest równa (131 razy 0,10) (114 razy 0,15) (119 razy 0,25) (137 razy 0,50) (0,10 0,15 0,25 0,50) 128,45 zaokrąglona do 128. Prognoza z lutego równa się (114 razy 0,10) (119 razy 0,15) (137 razy 0,25) (128 razy 0,50) 1 127,5 zaokrąglone do 128. Prognoza marcowa wynosi (119 razy 0,10) (137 razy 0,15) (128 razy 0,25) (128 razy 0,50) 1 128,45 zaokrąglona do 128. 3.2.10 Metoda 10: wygładzanie liniowe Ta metoda oblicza średnią ważoną danych z przeszłych sprzedaży. W obliczeniach ta metoda wykorzystuje liczbę okresów historii zamówień sprzedaży (od 1 do 12) wskazaną w opcji przetwarzania. System wykorzystuje matematyczną progresję do ważenia danych w zakresie od pierwszego (najmniej ważonego) do końcowego (większa waga). Następnie system wyświetla te informacje dla każdego okresu w prognozie. Metoda ta wymaga dopasowania miesiące najlepiej wraz z historią zamówienia sprzedaŜy dla liczby okresów podanych w opcji przetwarzania. 3.2.10.1 Przykład: Metoda 10: Wygładzanie liniowe Ta metoda jest podobna do metody 9, WMA. Jednak zamiast arbitralnie przypisywać wagi do danych historycznych, stosuje się formułę, aby przypisać wagi, które zmniejszają się liniowo i sumują się do 1,00. Następnie metoda oblicza średnią ważoną ostatniej historii sprzedaży, aby uzyskać projekcję krótkoterminową. Podobnie jak w przypadku wszystkich technik liniowej średniej kroczącej prognozowanie, błędy prognoz i błędy systemowe pojawiają się, gdy historia sprzedaży produktu wykazuje silny trend lub sezonowe wzorce. Ta metoda sprawdza się lepiej w przypadku prognoz krótkiego zasięgu produktów dojrzałych niż produktów na etapie wzrostu lub starzenia się w cyklu życia. n równa się liczbie okresów historii sprzedaŜy do wykorzystania w kalkulacji prognozy. For example, specify n equals 4 in the processing option to use the most recent four periods as the basis for the projection into the next time period. The system automatically assigns the weights to the historical data that decline linearly and sum to 1.00. For example, when n equals 4, the system assigns weights of 0.4, 0.3, 0.2, and 0.1, with the most recent data receiving the greatest weight. Minimum required sales history: n plus the number of time periods that are required for evaluating the forecast performance (periods of best fit). This table is history used in the forecast calculation: 3.2.11 Method 11: Exponential Smoothing This method calculates a smoothed average, which becomes an estimate representing the general level of sales over the selected historical data periods. This method requires sales data history for the time period that is represented by the number of periods best fit plus the number of historical data periods that are specified. The minimum requirement is two historical data periods. This method is useful to forecast demand when no linear trend is in the data. 3.2.11.1 Example: Method 11: Exponential Smoothing This method is similar to Method 10, Linear Smoothing. In Linear Smoothing, the system assigns weights that decline linearly to the historical data. In Exponential Smoothing, the system assigns weights that exponentially decay. The equation for Exponential Smoothing forecasting is: Forecast alpha (Previous Actual Sales) (1 ndashalpha) (Previous Forecast) The forecast is a weighted average of the actual sales from the previous period and the forecast from the previous period. Alpha is the weight that is applied to the actual sales for the previous period. (1 ndash alpha) is the weight that is applied to the forecast for the previous period. Values for alpha range from 0 to 1 and usually fall between 0.1 and 0.4. The sum of the weights is 1.00 (alpha (1 ndash alpha) 1). You should assign a value for the smoothing constant, alpha. If you do not assign a value for the smoothing constant, the system calculates an assumed value that is based on the number of periods of sales history that is specified in the processing option. alpha equals the smoothing constant that is used to calculate the smoothed average for the general level or magnitude of sales. Values for alpha range from 0 to 1. n equals the range of sales history data to include in the calculations. Generally, one year of sales history data is sufficient to estimate the general level of sales. For this example, a small value for n (n 4) was chosen to reduce the manual calculations that are required to verify the results. Exponential Smoothing can generate a forecast that is based on as little as one historical data point. Minimum required sales history: n plus the number of time periods that are required for evaluating the forecast performance (periods of best fit). This table is history used in the forecast calculation: 3.2.12 Method 12: Exponential Smoothing with Trend and Seasonality This method calculates a trend, a seasonal index, and an exponentially smoothed average from the sales order history. The system then applies a projection of the trend to the forecast and adjusts for the seasonal index. This method requires the number of periods best fit plus two years of sales data, and is useful for items that have both trend and seasonality in the forecast. You can enter the alpha and beta factor, or have the system calculate them. Alpha and beta factors are the smoothing constant that the system uses to calculate the smoothed average for the general level or magnitude of sales (alpha) and the trend component of the forecast (beta). 3.2.12.1 Example: Method 12: Exponential Smoothing with Trend and Seasonality This method is similar to Method 11, Exponential Smoothing, in that a smoothed average is calculated. However, Method 12 also includes a term in the forecasting equation to calculate a smoothed trend. The forecast is composed of a smoothed average that is adjusted for a linear trend. When specified in the processing option, the forecast is also adjusted for seasonality. Alpha equals the smoothing constant that is used in calculating the smoothed average for the general level or magnitude of sales. Values for alpha range from 0 to 1. Beta equals the smoothing constant that is used in calculating the smoothed average for the trend component of the forecast. Values for beta range from 0 to 1. Whether a seasonal index is applied to the forecast. Alpha and beta are independent of one another. They do not have to sum to 1.0. Minimum required sales history: One year plus the number of time periods that are required to evaluate the forecast performance (periods of best fit). When two or more years of historical data is available, the system uses two years of data in the calculations. Method 12 uses two Exponential Smoothing equations and one simple average to calculate a smoothed average, a smoothed trend, and a simple average seasonal index. An exponentially smoothed average: An exponentially smoothed trend: A simple average seasonal index: Figure 3-3 Simple Average Seasonal Index The forecast is then calculated by using the results of the three equations: L is the length of seasonality (L equals 12 months or 52 weeks). t is the current time period. m is the number of time periods into the future of the forecast. S is the multiplicative seasonal adjustment factor that is indexed to the appropriate time period. This table lists history used in the forecast calculation: This section provides an overview of Forecast Evaluations and discusses: You can select forecasting methods to generate as many as 12 forecasts for each product. Each forecasting method might create a slightly different projection. When thousands of products are forecast, a subjective decision is impractical regarding which forecast to use in the plans for each product. The system automatically evaluates performance for each forecasting method that you select and for each product that you forecast. You can select between two performance criteria: MAD and POA. MAD is a measure of forecast error. POA is a measure of forecast bias. Both of these performance evaluation techniques require actual sales history data for a period specified by you. The period of recent history used for evaluation is called a holdout period or period of best fit. To measure the performance of a forecasting method, the system: Uses the forecast formulas to simulate a forecast for the historical holdout period. Makes a comparison between the actual sales data and the simulated forecast for the holdout period. When you select multiple forecast methods, this same process occurs for each method. Multiple forecasts are calculated for the holdout period and compared to the known sales history for that same period. The forecasting method that produces the best match (best fit) between the forecast and the actual sales during the holdout period is recommended for use in the plans. This recommendation is specific to each product and might change each time that you generate a forecast. 3.3.1 Mean Absolute Deviation Mean Absolute Deviation (MAD) is the mean (or average) of the absolute values (or magnitude) of the deviations (or errors) between actual and forecast data. MAD is a measure of the average magnitude of errors to expect, given a forecasting method and data history. Because absolute values are used in the calculation, positive errors do not cancel out negative errors. When comparing several forecasting methods, the one with the smallest MAD is the most reliable for that product for that holdout period. When the forecast is unbiased and errors are normally distributed, a simple mathematical relationship exists between MAD and two other common measures of distribution, which are standard deviation and Mean Squared Error. For example: MAD (Sigma (Actual) ndash (Forecast)) n Standard Deviation, (sigma) cong 1.25 MAD Mean Squared Error cong ndashsigma2 This example indicates the calculation of MAD for two of the forecasting methods. This example assumes that you have specified in the processing option that the holdout period length (periods of best fit) is equal to five periods. 3.3.1.1 Method 1: Last Year to This Year This table is history used in the calculation of MAD, given Periods of Best Fit 5: Mean Absolute Deviation equals (2 1 20 10 14) 5 9.4. Based on these two choices, the Moving Average, n 4 method is recommended because it has the smaller MAD, 9.4, for the given holdout period. 3.3.2 Percent of Accuracy Percent of Accuracy (POA) is a measure of forecast bias. When forecasts are consistently too high, inventories accumulate and inventory costs rise. When forecasts are consistently too low, inventories are consumed and customer service declines. A forecast that is 10 units too low, then 8 units too high, then 2 units too high is an unbiased forecast. The positive error of 10 is canceled by negative errors of 8 and 2. (Error) (Actual) ndash (Forecast) When a product can be stored in inventory, and when the forecast is unbiased, a small amount of safety stock can be used to buffer the errors. In this situation, eliminating forecast errors is not as important as generating unbiased forecasts. However, in service industries, the previous situation is viewed as three errors. The service is understaffed in the first period, and then overstaffed for the next two periods. In services, the magnitude of forecast errors is usually more important than is forecast bias. POA (SigmaForecast sales during holdout period) (SigmaActual sales during holdout period) times 100 percent The summation over the holdout period enables positive errors to cancel negative errors. When the total of forecast sales exceeds the total of actual sales, the ratio is greater than 100 percent. Of course, the forecast cannot be more than 100 percent accurate. When a forecast is unbiased, the POA ratio is 100 percent. A 95 percent accuracy rate is more desirable than a 110 percent accurate rate. The POA criterion selects the forecasting method that has a POA ratio that is closest to 100 percent. This example indicates the calculation of POA for two forecasting methods. This example assumes that you have specified in the processing option that the holdout period length (periods of best fit) is equal to five periods. 3.3.2.1 Method 1: Last Year to This Year This table is history used in the calculation of MAD, given Periods of Best Fit 5: 3.4.2 Forecast Accuracy These statistical laws govern forecast accuracy: A long term forecast is less accurate than a short term forecast because the further into the future you project the forecast, the more variables can affect the forecast. A forecast for a product family tends to be more accurate than a forecast for individual members of the product family. Some errors cancel each other as the forecasts for individual items summarize into the group, thus creating a more accurate forecast. 3.4.3 Forecast Considerations You should not rely exclusively on past data to forecast future demands. These circumstances might affect the business, and require you to review and modify the forecast: New products that have no past data. Plans for future sales promotion. Changes in national and international politics. New laws and government regulations. Weather changes and natural disasters. Innovations from competition. You can use long term trend analysis to influence the design of the forecasts: Leading economic indicators. 3.4.4 Forecasting Process You use the Refresh Actuals program (R3465) to copy data from the Sales Order History File table (F42119), the Sales Order Detail File table (F4211), or both, into either the Forecast File table (F3460) or the Forecast Summary File table (F3400), depending on the kind of forecast that you plan to generate. Scripting on this page enhances content navigation, but does not change the content in any way. Forecasting Computer Usage Julie M. Hays University of St. Thomas Journal of Statistics Education Volume 11, Number 1 (2003), ww2.amstat. orgpublicationsjsev11n1datasets. hays. html Copyright copy 2003 by Julie M. Hays, all rights reserved. This text may be freely shared among individuals, but it may not be republished in any medium without express written consent from the author and advance notification of the editor. Key Words: Causal forecasting Model-building Seasonal Variation Simple linear regression Time-series forecasting Transformations. The dataset bestbuy. dat. txt contains actual monthly data on computer usage (Millions of Instructions Per Second, MIPS) and total number of stores from August 1996 to July 2000. Additionally, information on the planned number of stores through December 2001 is available. This dataset can be used to compare time-series forecasting with trend and seasonality components and causal forecasting based on simple linear regression. The simple linear regression model exhibits unequal error variances, suggesting a transformation of the dependent variable. 1. Introduction One of the most prevalent uses of regression analysis in actual business settings is for forecasting. For a summary of some forecasting methods see Armstrong (2001) or Arsham (2002). The bestbuy. dat. txt dataset can be used to demonstrate and discuss both time-series and causal forecasting. Time constraints and the interests and needs of the students determine whether I supply the analyses or have the students perform the analyses. I have used this dataset throughout the semester in an MBA Decision Analyses class. This class is a core requirement for all evening MBA students and covers a range of decision analysis and statistical topics, including regression analysis and forecasting. Most students are required to take an introductory business statistics course prior to this course, so they have had some exposure to statistical topics, but few students have any academic experience with forecasting. Best Buy Co. Inc. (NYSE:BBY), headquartered in Eden Prairie, Minnesota, is the largest volume specialty retailer of consumer electronics, personal computers, entertainment software and appliances. In August of each year, Best Buy purchases mainframe MIPS (Millions of Instructions Per Second, a measure of computing resources) in anticipation of the coming holiday season. Computing resources are needed to track and analyze retail information needed for billing, inventory, and sales. For planning and budgeting purposes they also wish to forecast the number of MIPS needed the following year. Best Buy Corporation actually used this dataset to predict computer usage in order to budget for and purchase an appropriate amount of computing power. However, prior to 2001, Best Buy did not do any statistical analysis of this data. Best Buy only looked at the numbers (they did not even graph the data) and then guessed at the amount of MIPS needed in the coming year. Students are asked to forecast the MIPS needed for December 2000 and December 2001 using the bestbuy. dat. txt dataset. This dataset was obtained from the Best Buy Corporation and contains monthly data on computer usage (MIPS) and total number of stores from August 1996 to July 2000. Additionally, information on the planned number of stores through December 2001 is available. Students can easily understand the seasonality that retail operations experience. Best Buy Corporation has experienced significant growth over the past few years and most students understand that as a firm grows, their need for computing power also increases. Therefore, this dataset can be used to demonstrate time-series forecasting with both a trend and seasonality. This dataset can also be used to demonstrate causal forecasting based on simple linear regression of computer usage and number of stores. The simple linear regression model exhibits unequal error variances, suggesting a transformation of the dependent variable. Finally, a comparison between the time-series model and causal model can be made and discussed with the students. 2. Time Series Forecasting Before I allow the students to begin any numerical analyses, I have the students plot computer usage versus time. I have the students forecast the number of MIPS needed for December 2000 and December 2001 using only the plot of computer usage (MIPS) versus time, Figure 1. The plot clearly shows a trend in MIPS usage with time. Typically, students eyeball the graph and predict MIPS usage of 500 for December 2000 and 600 for December 2001. Figure 1. MIPS vs Time. Students who actually fit a line to the data forecast MIPS usage of 527 for December 2000 and 624 for December 2001 (Figure 2 ). Figure 2. MIPS vs Time. I introduce simple moving average, weighted moving average and exponential smoothing forecasting techniques to the students before they attempt to use these forecasting models to predict future MIPS usage. I also discuss the evaluation of forecasting models using MAD and CFE (explained below). The interested reader can find more detailed discussions of these topics in Stevenson (2002) or at Sparling (2002). Moving Average An n - period moving average is the average value over the previous n time periods. As you move forward in time, the oldest time period is dropped from the analysis. Weighted Moving Average An n - period weighted moving average allows you to place more weight on more recent time periods by weighting those time periods more heavily. Exponential Smoothing The forecast for the next period using exponential smoothing is a smoothing constant, ( 0 1), times the demand in the current period plus (1- smoothing constant) times the forecast for the current period. where F t1 is the forecast for the next time period, F t is the forecast for the current time period, D t is the demand in the current time period, and 0 1 is the smoothing constant. To initiate the forecast, assume F 1 D 1 . Higher values of a place more weight on the more current time periods. Because this model is less intuitive, I usually expand this equation to help the students understand that demand from time periods prior to the current period is included in this model. and where D t-1 is the demand in the previous time period, D t-2 is the demand in the time period before the previous time period, and F t-1 is the forecast in the previous time period, and F t-2 is the forecast in the time period before the previous time period. Because the data storage requirements are considerably less than for the moving average model, this type of model was used extensively in the past. Now, although data storage is not usually an issue, it is typical of real-world business applications because of its historical usage. Mean Absolute Deviation (MAD) The evaluation of forecasting models is based on the desire to produce forecasts that are unbiased and accurate. The Mean Absolute Deviation (MAD) is one common measure of forecast accuracy. Cumulative sum of Forecast Errors (CFE) The Cumulative sum of Forecast Errors (CFE) is a common measure of forecast bias. Better models would have lower MAD and CFE close to zero. After explaining these techniques, I have the students work through the following simple example in class. I give the students the demand profile (Table 1 ) and have them calculate forecasts using a 3-period moving average and exponential smoothing with a smoothing constant of 0.2. I also have them calculate the MAD and CFE for both models. We discuss using the MAD and CFE to determine the best model. I also point out to the students that I have arbitrarily chosen the number of periods for the moving average model and the smoothing constant for the exponential smoothed model. I discuss using MAD and CFE to determine the best choice for these variables. Table 1. In-class forecasting example. All numbers rounded to the nearest hundredth Once the students are familiar with these techniques, I have them estimate MIPS for December 2000 and 2001 using a 3-period moving average and exponential smoothing with a smoothing constant of 0.2 (Figure 3 ). This can be done using Excel, Minitab or any statistics package. The forecast for the 3-period moving average is 463 MIPS and for the exponential smoothed is 450 MIPS. Figure 3. Actual and forecast MIPS. The students can easily see that there is a problem with their forecasts. Although I have told the students that exponential smoothing and moving average forecasting models are only appropriate for stationary data, they dont really understand this until they try to use the technique. This exercise helps the students understand that moving average and exponential smoothing are really only averaging techniques and helps them comprehend the need to account for trends in forecasting. I demonstrate adjusting for trends by using double exponential smoothing. Double exponential smoothing is a modification of simple exponential smoothing that effectively handles linear trends. Good explanations of this technique can be found in Wilson and Keating (2002) or at Group6 (2002). Double Exponential Smoothing where F t1 is the forecast for the next time period, A t is the exponentially smoothed level component in the current period where F t is the forecast for the current time period, D t is the demand in the current time period, and 0 1 is the smoothing constant and T t is the exponentially smoothed trend component in the current period. where 0 1 is the smoothing constant for the trend, T t-1 is the trend in the previous period, and C t is the current trend The forecast for n periods into the future is After I explain this model, I have the students go back and re-estimate their forecast using this model (Figure 4 ). Minitab has these functions built in and will compute the optimal smoothing parameters, and , based on minimizing the sum of squared errors, but any statistics package could be used. Minitab will also compute Mean Absolute Prediction Error (MAPE), Mean Absolute Deviation (MAD), Mean Square Error (MSE) and provides 95 confidence prediction intervals (see Figure 4 ). The forecasts obtained are essentially the same as the forecasts obtained from fitting a line to the data, MIPS usage of 527 for December 2000 and 624 for December 2001. Figure 4. Optimal double exponential smoothed. I ask the students if they are happy with their forecast now or if there is anything else they need to do. I supply a plot of errors versus time for the double exponential smoothed model with the December errors highlighted (Figure 5 ). Most students are aware that retail firms have their highest sales during the Christmas season (December). Therefore, students typically mention seasonality and we discuss the possible ways that we could account for seasonality. Figure 5. Double exponential smoothed model errors. The students usually mention both an additive and multiplicative adjustment for seasonality using all the past data or only some of the past data. Simple explanations of these two techniques can be found in Hanke and Reitsch (1998) or at Nau (2002). In other words, we could compare the forecast for December 1999 to the actual for December 1999 and for the additive model we would add this difference to our forecast for December 2000. Or, for the multiplicative model, we would multiply the forecast for December 2000 by the actual December 1999forecast December 1999. They carry this further and discuss using the data from 1998, 1997, and 1996 to produce an average adjustment. I lead the discussion towards the smoothing techniques we have been discussing and how we could use these types of techniques to come up with seasonal adjustments for our forecasts. I explain that Winter developed just such a technique of triple exponential smoothing. Winters technique basically adds (or multiplies) a smoothed seasonal adjustment to the model, similar to the addition of a smoothed adjustment for a trend in the double exponential smoothed model. The interested reader can find the calculation formulas and explanations of triple exponential smoothing (or Winters method) in Minitab (1998b) or Prins (2002a). I use Minitab to demonstrate Winters model (Figure 6 ) because the calculations for this method are fairly complex and most students only need to have a general understanding of this type of technique. Using Winters model the forecast for December 2000 is 521 MIPS and the forecast for December 2001 is 606 MIPS. I also use this opportunity to mention ARIMA models and direct interested students to resources such as Minitab (1998a) for more information about ARIMA models. Figure 6. Winters Method. 3. Causal Forecasting I supply the students with a plot of computer usage (MIPS) vs. number of stores (Figure 7 ) and again have them forecast computer usage for December 2000 and December 2001. Best Buy believes that they will have 394 stores in December of 2000 and 445 stores in December of 2001. Figure 7. MIPS vs number of stores. Again most students eyeball the graph and use graphical linear extrapolation to arrive at their forecast. They predict usage of 600 MIPS for December 2000 and 800 MIPS for December 2001. I have the students perform a simple linear regression of MIPS on number of stores and produce the residual plot (Figures 8 and 9 ). I use this opportunity to emphasize the usefulness of the residual plot in evaluating the model. I highlight the megaphone shape of the residual plot (the residuals are increasing as the number of stores increases) and explain that this implies that a transformation of the dependent variable is indicated. Figure 8. MIPS vs number of stores. Figure 9. MIPS vs number of stores residual plot. Although I used the Box-Cox procedure (Box and Cox 1964 ) to determine the appropriate transformation, this technique is beyond the scope of this class. Therefore, I just tell the students that the appropriate transformation is square root of MIPS and mention that there are mathematical techniques that can be used to determine the appropriate transformation. I direct interested students to Neter, Kutner, Nachtsheim, and Wasserman (1996) or Prins (2002b) for descriptions of this technique. I have the students re-estimate the regression equation and produce the residual plot for this regression (Figures 10 and 11 ). Although the R 2 is slightly lower, the residuals are now more evenly distributed. Figure 10. Square root MIPS vs number of stores. Figure 11. Square root MIPS vs number of stores residual plot. I also have the students predict computer usage for December 2000 and December 2001 using the fitted equation. If students have difficulty predicting MIPS, because of the square root transformation of MIPS, I explain the calculations in class. The new predictions are 664 MIPS for December 2000 and 977 MIPS for December 2001. Again, an adjustment for seasonality could be made. Although, any of the seasonality adjustments discussed in the previous section could be used here, I usually have the students use an average multiplicative adjustment. This could be done by calculating actualpredicted for all months, averaging these seasonal factors for each particular month and multiplying the resulting seasonal factor by the predicted value. If this is done, the new predictions for December 2000 and December 2001 are 700 MIPS and 1029 MIPS. 4. Comparison of Methods After the students have used the various methods to predict MIPS usage, I have them discuss which method they have most confidence in and why they believe that that model is the best. Several important points can be made here. First, I emphasize that forecasting is a very imperfect science and no technique can perfectly predict the future. The best technique will balance the accuracy needed with the complexity (or cost) of the model. Second, I emphasize the value of plotting the data. One of the best (and easiest) methods to evaluate various models is a visual examination of the data and forecasts that would be produced by the method under consideration. Third, I emphasize the need to account for trends and seasonality if those are present in the data. Moving averages and exponential smoothing are appropriate forecasting methods only if the data are stationary. If there are trends andor seasonalities present, more sophisticated methods should be used. Finally, we discuss the difficulty inherent in finding a causal predictor for most values we wish to predict in business environments. 5. Conclusion The dataset bestbuy. dat. txt can be used to demonstrate both time series and causal forecasting. Analysis of the dataset leads to a discussion and comparison of the positives and negatives of various forecasting methods. 6. Obtaining the Data The file bestbuy. dat. txt contains the raw data. The file bestbuy. txt is a documentation file containing a brief description of the dataset. Appendix - Key to the variables in bestbuy. dat. txt

Comments