Gleitendurchschnittliche Ökonometrie


Moving Average - MA. BREAKING DOWN Moving Average - MA. As ein SMA Beispiel, betrachten Sie eine Sicherheit mit den folgenden Schlusskurse über 15 Tage. Week 1 5 Tage 20, 22, 24, 25, 23.Week 2 5 Tage 26, 28 , 26, 29, 27.Week 3 5 Tage 28, 30, 27, 29, 28.A 10-Tage-MA würde die Schlusspreise für die ersten 10 Tage als ersten Datenpunkt ausgleichen Der nächste Datenpunkt würde am frühesten fallen Preis, fügen Sie den Preis am Tag 11 und nehmen Sie den Durchschnitt, und so weiter wie unten gezeigt. Wie bereits erwähnt, MAs nach der aktuellen Preis-Aktion, weil sie auf vergangene Preise basieren, je länger die Zeit für die MA, desto größer die lag So Ein 200-Tage-MA wird eine viel größere Verzögerung als ein 20-Tage-MA haben, weil es Preise für die letzten 200 Tage enthält. Die Länge der MA zu verwenden, hängt von den Handelszielen ab, wobei kürzere MAs für den kurzfristigen Handel verwendet werden Und längerfristige MAs mehr geeignet für langfristige Investoren Die 200-Tage-MA ist weit gefolgt von Investoren und Händlern, mit Pausen über und unter diesem gleitenden Durchschnitt als wichtige Handelssignale. MAs auch vermitteln wichtige Handelssignale auf eigene Faust, Oder wenn zwei Durchschnitte kreuzen Ein aufsteigender MA zeigt an, dass die Sicherheit in einem Aufwärtstrend ist, während ein abnehmender MA anzeigt, dass es sich in einem Abwärtstrend befindet. Ähnlich wird der Aufwärtsimpuls mit einem bullish Crossover bestätigt, der auftritt, wenn ein kurzfristiges MA über einen längeren übergeht - Modus MA Abwärts-Impuls wird mit einem bärigen Crossover bestätigt, der auftritt, wenn ein kurzfristiges MA unter einem längerfristigen MA übergeht. Stellen Sie sich vor, Sie haben Daten über Preise für viele Produkte. Für jedes der Produkte, die Sie wöchentliche Preisinformationen aufzeichnen. clear set obs 200.gen prodid n. Jedes Produkt hat einen einzigartigen durchschnittlichen Preis gen prodprice rpoisson 5 7. Sie haben Daten über wöchentliche Preise für 200 Wochen erweitern 200 bysort prodid gen t n Label var t Woche. Es gibt auch einige saisonale Variation gen saisonale 2 sin pi t 50. Sowie eine allgemeine Zeit Trend geben Trend t 005. Die erste Beobachtung ist nicht korreliert mit etwas gen Preis prodprice 2 5 Trend rpoisson 10 10 wenn t 1 ersetzen Preis prodprice 2 Trend saisonal 7 Preis n-1 3 rpoisson 10 10 wenn t 2 ersetzen preis prodprice trend saisonal 5 preis n-1 2 preis n-2 3 rpoisson 10 10 wenn t 3 ersetzen preis prodprice trend saisonal 3 preis n-1 2 preis n - 2 2 Preis n-3 3 rpoisson 10 10 wenn t 4 ersetzen preis prodprice trend saisonal 3 preis n-1 175 preis n-2 125 preis n-3 1 preis n-4 3 rpoisson 10 10 wenn t 4. Erstellen Sie eine globabl zu Speichern globale twograph. forv i 1 6 globale twot line Preis t wenn prodid i. twoway twograph, Legende aus Titel True Preis Trends für die ersten sechs Produkte. Nun stell dir vor, dass die oben erzeugten Daten die wahren Preisinformationen sind, die grundsätzlich nicht beobachtbar sind. Stattdessen haben Sie mehrere Sammlungen von Daten pro Woche auf Preise, die jeweils durch einige zufällige addative Fehler erweitern 3.bysort prodid t gen prodobs n. gen pricecollect Preis rnormal 25. Jedoch die Preisinformationen, die Sie haben hat einige Einträge, die 10 irrtümlich gewesen sind Eingegebene falsch. gen Eintragfehler rbinomial 1, 1 gen scalarerror rnormal 1.gen priceobs pricecollect 1 entryerror scalarerror label var priceobs Aufgezeichneter Preis. Darüber hinaus wurden 35 Ihrer Preisdaten nie gesammelt Gen fehlende rbinomial 1, 35.drop wenn fehlt 1. Erstellen Sie eine globabl, um globale twograph. forv i 1 6 globale twog line Preisobs t Wenn prodid ich prodobs 1.zwoway twograph, Legende Off title Beobachtete Preisentwicklung für die ersten sechs Produkte. keep t priceobs prodid entryerror Ich halte Eintrag Eintrag Fehler in den Datensatz als ein Mittel des Vergleichs, obwohl es nicht direkt beobachtet werden würde. Die Frage ist. Kannst du jetzt mit diesen unordentlichen Daten die Preisdaten wiederherstellen, die dem Original ähnlich sind. Das erste, was wir ausnutzen sollten, ist das doppelte aufgezeichnete data. scatter priceobs t wenn prodid 1, title Es ist leicht, einzelne Abweichungen zu sehen. Es ist leicht, einzelne Abweichungen zu sehen, aber wir wollen nicht durch alle 200 Produkte gehen, um individuell Preisausreißer zu identifizieren Wir wollen mit einem System, um Ausreißer zu identifizieren. Lassen Sie s einen Mittelwert durch Produkt und Zeit durch sortieren prodid t egen pricemean mean priceobs. Lassen Sie s jede Beobachtung feststellen, die 120 größer ist als der Mittelwert oder 80 weniger als die mittlere Gen-Flagge pricemean priceobs 1 2 pricemean priceobs 8. Lassen Sie s sehen, wie es arbeitet zwei streuung Preisobs t Wenn prodid 1 scatter priceobs t wenn prodid 1 flag 1 Msymbol lgx title Einige der Ausreißer können identifiziert werden, wenn man nur die mittlere Legende aussieht. corr flag entryerror Unsere Flagge ist über 45 mit den Eintragsfehlern korreliert. Das ist gut, aber wir können es besser machen. Ich schlage vor, dass anstatt nur den Mittelwert zu verwenden, dass wir einen gleitenden Durchschnitt der Preise konstruieren und sehen, wie jeder Eintrag vom Durchschnitt abweicht. Das einzige Problem ist, dass der gleitende durchschnittliche Befehl xtset erfordert und das nur einen Eintrag pro Zeit benötigt. Also sage ich Wir rescale die zeitvariable und addieren, als ob zu einer anderen zeit der woche die beobachtungszahl aufgezeichnet Wir müssen neu produzieren prodobs, da wir nicht wissen, welche Beobachtung fehlt aus jedem Produkt bysort prodid t gen prodobs n. gen t2 t 4 prodobs. Xtset setzt die Panel-Daten-Panel-ID und Zeitreihen-Ebene xtset prodid t2. Der Befehl, den wir verwenden werden, ist tssmooth. Es ist so codiert, dass es durch die Angabe von ma bedeutet, dass sich der Durchschnitt bewegt und das Fenster sagt Stata wie viele Zeitspannen, um voranzukommen und wieviele hinter in der bewegten Luftfahrt Dieser Befehl kann ein wenig dauern, während tsmooth ma mapriceobs priceobs, Fenster 23 0 23 23 ist in Effekt 5 Wochen vor und 5 Wochen hinter Die 0 sagt stata nicht zu behalten sich in diesem Durchschnitt. Der gleitende Durchschnitt zwei Scatter Preisobs t Wenn prodid 1 Zeile mapriceobs t wenn prodid 1 Zeile pricemean t wenn prodid 1 Titel Der Moving Average ist weniger ansprechbar für Ausreißer. Der gleitende Durchschnitt ist stabiler als nur der Zeitdurchschnitt. Lassen Sie s versuchen zu markieren mit dem gleitenden Durchschnitt Cap Drop Flag2 Gen Flag2 Mapriceobs Preisobs 1 2 Mapriceobs Preisobs 8.two Scatter Preisobs t Wenn prodid 1 Scatter Preisobs t Wenn prodid 1 flag2 1 msymbol lgx Titel Die Moving Average kann auch nützlich Legende off. corr Flag2 entryerror Drop unsere markierten Daten fallen, wenn flag2 1. Collapse auf die wöchentliche Ebene kollabieren priceobs, von prodid t label var priceobs Mittlerer Preis beobachtet. forv i 1 6 globale twograph scatter priceobs t wenn prodid i. twoway twog, Legende aus Titel Beobachtete Preisentwicklung für Erste sechs produkte Die Daten sehen viel besser aus, aber wir haben immer noch einige unerwünschte Ausreißer. Wir könnten die Vorteile der Cross-Produkt-Trends nutzen, um zu helfen, Ausreißer in Produktpreisen zu identifizieren, indem sie sich mit den Preisen in Verbindung setzen. Preisgeld aveprice, wenn prodid 1 vorhergesagt res1, residual. reg priceobs aveprice if prodid 2 vorherzusagen resid2, residual. reg priceobs aveprice if prodid 3 Vorhersage von Rest3, Restdatoweil Residenz 1 t falls prodid 1 line priceobs t wenn prodid 1 line resid2 t wenn prodid 2 line priceobs t wenn prodid 2 line resid3 t wenn prodid 3 line priceobs t wenn prodid 3 title Die residuals sind eindeutige indikatoren von Ausreißer Legende aus. Schließlich lassen wir Beobachtungen mit Resten, die größer als 1 5 Standardabweichungen von den Mittelwerten sind, für den Fall, wenn prodid ich vorherzusagen, Respekt, Restsumme Respekt, Mittlere Tropfenreserve Lassen Sie s sehen, wie es funktioniert zwei Scatter Preisobs t Wenn prodid 2 Scatter Preisobs t Wenn prodid 2 Flagge 1 msymbol lgx Titel Jetzt nur versuchen, entfernen Sie einige endgültige Ausreißer Legende aus. Plotten des Produkts 1 Pricing im Vergleich zu Ausreißern global twograph. forv i 1 6 globale twog line priceobs t wenn prodid i. Schließlich fallen die Ausreißer fallen, wenn Flagge. Eine endgültige Grafik globale twograph. forv i 1 6 globale twograph scatter priceobs t wenn prodid i. twoway twog, Legende aus Titel Beobachtete Preisentwicklung für die ersten sechs Produkte. Nicht so sauber wie unsere erste grafische aber definitiv viel verbessert. Moving averages. Moving averages. With konventionelle datasets der Mittelwert ist oft die erste und eine der nützlichsten, zusammenfassenden Statistiken zu berechnen Wenn Daten in Form einer Zeitreihe sind Ist das Serienmittel ein nützliches Maß, aber spiegelt nicht die dynamische Natur der Daten Mittelwerte, die über kurzgeschlossene Perioden berechnet wurden, die entweder der aktuellen Periode vorausgeht oder auf der aktuellen Periode zentriert sind, sind oft nützlicher, da solche Mittelwerte variieren oder Bewegen, wie die aktuelle Periode bewegt sich von der Zeit t 2, t 3 usw. sie sind bekannt als gleitende Durchschnitte Mas Ein einfacher gleitender Durchschnitt ist in der Regel der ungewichtete Durchschnitt der k vorherigen Werte Ein exponentiell gewichteter gleitender Durchschnitt ist im Wesentlichen das gleiche wie ein einfacher gleitender Durchschnitt, Aber mit Beiträgen zum Mittelwert gewichtet durch ihre Nähe zur gegenwärtigen Zeit Weil es nicht eine, sondern eine ganze Reihe von gleitenden Durchschnitten für jede gegebene Reihe gibt, kann der Satz von Mas selbst auf Graphen aufgetragen, als Reihe analysiert und verwendet werden In Modellierung und Prognose Eine Reihe von Modellen kann mit gleitenden Durchschnitten konstruiert werden, und diese werden als MA-Modelle bezeichnet. Wenn solche Modelle mit autoregressiven AR-Modellen kombiniert werden, sind die resultierenden zusammengesetzten Modelle als ARMA - oder ARIMA-Modelle bekannt, die ich für integriert bin. Einfache Bewegung Durchdringt. Wenn eine Zeitreihe als ein Satz von Werten betrachtet werden kann, kann t 1,2,3,4, n der Durchschnitt dieser Werte berechnet werden. Wenn wir annehmen, dass n ziemlich groß ist und wir eine ganze Zahl k wählen, die Ist viel kleiner als n, wir können einen Satz von Blockdurchschnitten berechnen oder einfache gleitende Mittelwerte der Ordnung k. Jede Maßnahme repräsentiert den Mittelwert der Datenwerte über ein Intervall von k Beobachtungen. Beachten Sie, dass die erste mögliche MA der Ordnung k 0 die für ist Tk Im Allgemeinen können wir den zusätzlichen Index in die Ausdrücke oben und schreiben schreiben. Dies besagt, dass das geschätzte Mittel zum Zeitpunkt t der einfache Mittelwert des beobachteten Wertes zum Zeitpunkt t und der vorhergehenden k -1 Zeitschritte ist, wenn Gewichte angewendet werden, die abnehmen Der Beitrag der Beobachtungen, die weiter weg in der Zeit sind, wird der gleitende Durchschnitt exponentiell geglättet. Bewegliche Mittelwerte werden oft als eine Form der Prognose verwendet, wobei der Schätzwert für eine Reihe zum Zeitpunkt t & sub1 ;, St & sub1; MA für den Zeitraum bis zu und einschließlich Zeit teg heute s Schätzung basiert auf einem Durchschnitt der vorher aufgezeichneten Werte bis zu und einschließlich gestern s für die täglichen Daten. Einfache gleitende Durchschnitte können als eine Form der Glättung gesehen werden In dem Beispiel unten, die Luftverschmutzungsdatensatz, der in der Einleitung zu diesem Thema gezeigt wurde, wurde um eine 7-Tage gleitende durchschnittliche MA-Linie erweitert, die hier in rot gezeigt ist. Wie man sieht, glättet die MA-Linie die Peaks und Täler in den Daten und kann sehr hilfreich sein Identifizierung von Trends Die Standard-Vorwärts-Berechnungsformel bedeutet, dass die ersten k -1 Datenpunkte keinen MA-Wert haben, aber danach rechnen die Berechnungen bis zum endgültigen Datenpunkt in der Serie. PM10 tägliche Mittelwerte, Greenwich. source London Air Quality Network. One Grund Zum Berechnen einfacher gleitender Mittelwerte in der beschriebenen Weise ist, dass es ermöglicht, dass Werte für alle Zeitschlitze von der Zeit tk bis zur Gegenwart berechnet werden und als eine neue Messung für die Zeit t & sub1; erhalten wird, kann die MA für die Zeit t & sub1; addiert werden Zu dem bereits berechneten Satz Dies stellt eine einfache Prozedur für dynamische Datensätze dar. Allerdings gibt es einige Probleme mit diesem Ansatz Es ist vernünftig zu argumentieren, dass der Mittelwert über die letzten 3 Perioden, sagen, sollte zum Zeitpunkt t -1 liegen, nicht Zeit T und für eine MA über eine gerade Anzahl von Perioden vielleicht sollte es sich am Mittelpunkt zwischen zwei Zeitintervallen befinden Eine Lösung für dieses Problem ist die Verwendung von zentrierten MA Berechnungen, in denen die MA zum Zeitpunkt t ist der Mittelwert einer symmetrischen Satz von Werten um t Trotz seiner offensichtlichen Verdienste wird dieser Ansatz nicht generell verwendet, weil er verlangt, dass Daten für zukünftige Ereignisse verfügbar sind, was nicht der Fall sein kann. In Fällen, in denen die Analyse vollständig aus einer bestehenden Serie besteht, kann die Verwendung von zentriertem Mas möglich sein Vorzuziehen. Einfache gleitende Durchschnitte können als eine Form der Glättung betrachtet werden, Entfernen von Hochfrequenzkomponenten einer Zeitreihe und Hervorhebung, aber nicht das Entfernen von Trends in ähnlicher Weise wie die allgemeine Vorstellung von digitaler Filterung In der Tat sind die Bewegungsdurchschnitte eine Form von linear Filter Es ist möglich, eine gleitende Durchschnittsberechnung auf eine bereits geglättete Baureihe anzuwenden, dh eine bereits geglättete Baugruppe zu glätten oder zu filtern. Beispielsweise können wir mit einem gleitenden Durchschnitt von Ordnung 2, wie man sie mit Gewichten berechnet, so betrachten MA bei x 2 0 5 x 1 0 5 x 2 Ebenso gilt der MA bei x 3 0 5 x 2 0 5 x 3 Wenn wir eine zweite Glättung oder Filterung anwenden, haben wir 0 5 x 2 0 5 x 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 dh der 2-stufige Filterprozess oder die Faltung hat einen variabel gewichteten symmetrischen gleitenden Durchschnitt mit Gewichten erzeugt Mehrere Windungen können sehr komplexe gewichtete Bewegungsdurchschnitte erzeugen, von denen einige von besonderem Gebrauch in spezialisierten Bereichen gefunden wurden, wie z. B. in Lebensversicherungsberechnungen. Moving-Mittelwerte können verwendet werden, um periodische Effekte zu entfernen, wenn sie mit der Länge der Periodizität als bekannt berechnet werden Zum Beispiel können mit monatlichen Daten saisonale Variationen oft entfernt werden, wenn dies das Ziel ist, indem sie einen symmetrischen 12-Monats-Gleitender Durchschnitt mit allen Monaten gleichmäßig gewichtet, mit Ausnahme der ersten und letzten, die mit 1 2 gewichtet werden. Dies liegt daran, dass es 13 geben wird Monate im symmetrischen Modell aktuelle Zeit, t - 6 Monate Die Summe wird durch 12 geteilt. Ähnliche Verfahren können für jede klar definierte Periodizität angewendet werden. Exponentiell gewichtete Bewegungsdurchschnitte EWMA. Mit der einfachen gleitenden durchschnittlichen Formulare werden alle Beobachtungen gleich gewichtet Wenn wir Nannte diese gleichen Gewichte, t jedes der k Gewichte würde gleich 1 k, so dass die Summe der Gewichte wäre 1, und die Formel wäre. Wir haben bereits gesehen, dass mehrere Anwendungen dieses Prozesses in die Gewichte variieren mit exponentiell gewichtet bewegen Mittelt den Beitrag zum Mittelwert aus Beobachtungen, die in der Zeit mehr entfernt werden, wird abgelehnt, wodurch mehr neuere lokale Ereignisse hervorgehoben werden. Grundsätzlich wird ein Glättungsparameter, 0 1, eingeführt und die Formel auf eine symmetrische Version dieser Formel überarbeitet Der Form. Wenn die Gewichte im symmetrischen Modell als die Begriffe der Terme der Binomialexpansion ausgewählt werden, werden sie zu 1 addieren, und wenn q groß wird, wird die Normalverteilung angenähert. Dies ist eine Form Der Kernel-Gewichtung, wobei die Binomie als Kernfunktion fungiert. Die im vorigen Unterabschnitt beschriebene zweistufige Faltung ist genau diese Anordnung, wobei q 1 die Gewichte ergibt. Bei exponentieller Glättung ist es notwendig, einen Satz von Gewichten zu verwenden, die auf 1 summieren Und die Größe in der Größe geometrisch reduzieren Die verwendeten Gewichte sind typischerweise von der Form. Um zu zeigen, dass diese Gewichte auf 1 summieren, betrachten wir die Erweiterung von 1 als eine Serie. Wir können schreiben und den Ausdruck in Klammern mit der Binomialformel 1- xp erweitern X 1- und p -1, was dies gibt. Dies stellt dann eine Form des gewichteten gleitenden Durchschnitts der Form dar. Diese Summation kann als eine Wiederholungsrelation geschrieben werden. Das vereinfacht die Berechnung sehr und vermeidet das Problem, dass das Gewichtungsregime strikt sein sollte Unendlich für die Gewichte, um auf 1 für kleine Werte zu summieren ist in der Regel nicht der Fall Die Notation von verschiedenen Autoren verwendet variiert Einige verwenden den Buchstaben S, um anzuzeigen, dass die Formel im Wesentlichen eine geglättete Variable ist und schreiben. Wenn die Kontrolle Theorie Literatur oft Verwendet Z anstelle von S für die exponentiell gewichteten oder geglätteten Werte, z. B. Lucas und Saccucci, 1990, LUC1 und die NIST-Website für weitere Details und bearbeitete Beispiele Die oben zitierten Formeln stammen aus der Arbeit von Roberts 1959, ROB1, aber Hunter 1986 verwendet HUN1 einen Ausdruck des Formulars, der für die Verwendung in einigen Kontrollprozeduren geeigneter sein kann. Mit 1 ist die mittlere Schätzung einfach der gemessene Wert oder der Wert des vorherigen Datenelementes. Mit 0 5 ist die Schätzung der einfache gleitende Durchschnitt Der aktuellen und früheren Messungen Bei Prognosemodellen wird der Wert S t oft als Schätz - oder Prognosewert für die nächste Zeitperiode, dh als Schätzung für x zum Zeitpunkt t 1 verwendet. Dies zeigt also, dass der Prognosewert bei Die Zeit t & sub1; ist eine Kombination des vorherigen exponentiell gewichteten gleitenden Mittelwertes plus einer Komponente, die den gewichteten Vorhersagefehler repräsentiert, zum Zeitpunkt t. Wenn eine Zeitreihe gegeben ist und eine Prognose erforderlich ist, ist ein Wert für erforderlich. Dies kann aus dem Vorhandene Daten durch Auswertung der Summe der quadratischen Vorhersagefehler erhalten mit variierenden Werten für jede t 2,3 Einstellung der ersten Schätzung als der erste beobachtete Datenwert, x 1 In Steueranwendungen ist der Wert von wichtig, dass in der verwendet wird Bestimmung der oberen und unteren Kontrollgrenzen und beeinflusst die durchschnittliche Lauflänge ARL, die erwartet wird, bevor diese Kontrollgrenzen unter der Annahme gebrochen werden, dass die Zeitreihen einen Satz von zufälligen, identisch verteilten unabhängigen Variablen mit gemeinsamer Varianz darstellen. Unter diesen Umständen ist die Varianz der Kontrollstatistik. is Lucas und Saccucci, 1990. Kontrollimitierungen werden üblicherweise als feste Vielfache dieser asymptotischen Varianz eingestellt, zB - 3 mal der Standardabweichung Wenn beispielsweise 0 25 und die zu überwachenden Daten eine Normalverteilung haben, N 0,1, wenn in der Steuerung, die Kontrollgrenzen werden - 1 134 und der Prozess erreicht eine oder andere Grenze in 500 Schritten im Durchschnitt Lucas und Saccucci 1990 LUC1 leiten die ARLs für eine breite Palette von Werten und unter verschiedenen Annahmen mit Markov-Ketten-Verfahren Sie tabellieren die Ergebnisse, einschließlich der Bereitstellung von ARLs, wenn der Mittelwert des Kontrollprozesses um ein Vielfaches der Standardabweichung verschoben worden ist. Zum Beispiel mit einer 0 5-Schicht mit 0 25 ist die ARL weniger als 50 Zeitschritte Wie oben beschrieben, wird als einzelne exponentielle Glättung bezeichnet, da die Verfahren einmal auf die Zeitreihen angewendet werden und dann Analysen oder Kontrollprozesse auf dem resultierenden geglätteten Datensatz durchgeführt werden. Wenn der Datensatz einen Trend und / oder saisonale Komponenten enthält, zwei - oder dreistufige Exponentiale Glättung kann als Mittel zur Beseitigung der expliziten Modellierung dieser Effekte angewendet werden, siehe weiter, der Abschnitt über die Prognose unten und das NIST bearbeitete Beispiel. CHA1 Chatfield C 1975 Die Analyse der Times Series Theorie und Praxis Chapman und Hall, London. HUN1 Hunter J S 1986 Der exponentiell gewichtete gleitende Durchschnitt J der Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Exponentiell gewichtete Moving Average Control Schemes Eigenschaften und Erweiterungen Technometrics, 32 1, 1-12. ROB1 Roberts S W 1959 Kontrolltabelle Tests basierend auf geometrischen Moving Averages Technometrics, 1, 239-250.

Comments

Popular Posts