Die Formel für die Standardabweichung ist sowohl für den diskreten als auch für den kontinuierlichen Fall ziemlich einfach . Es ist meistens sicher, den diskreten Fall zu verwenden, wenn man mit angepassten Schlusskursen arbeitet. Sobald Sie die Standardabweichung für einen bestimmten Zeitraum berechnet haben, besteht die nächste Aufgabe (im einfachsten Fall) darin, den Mittelwert desselben Zeitraums zu berechnen. Dies erlaubt Ihnen eine grobe Annäherung an die Verteilung, was Ihnen alle Arten von testbaren Hypothesen liefern kann. Zwei Standardabweichungen (σ) weg vom Mittelwert (μ) sind gegeben durch:
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
adjclose | 15946 424.4896 481.9309 16.66 1667.47
Es macht keinen Sinn, über “zwei Standardabweichungen weg vom Preis” zu sprechen, es sei denn, dieser Preis ist der Mittelwert oder eine andere Statistik für einen bestimmten Zeitraum. Normalerweise würden Sie sich ansehen, wie weit der Preis vom Mittelwert entfernt ist, z.B. ob der Preis zwei oder drei Standardabweichungen vom Mittelwert oder einem anderen technischen Indikator wie dem Average True Range (ein exponentieller gleitender Durchschnitt der True Range), einem Unterstützungsniveau, einem anderen Wertpapier usw. entfernt ist.
Für den größten Teil dieser Antwort nehme ich an, dass wir den Mittelwert für die gewählte Zeitperiode als Basis verwenden. Dennoch ist die Antwort komplizierter, als viele Leute erkennen. Wie ich bereits sagte, müssen Sie sich zur Berechnung der Standardabweichung für eine Zeitperiode entscheiden. Zum Beispiel könnten Sie die S&P 500 Daten von Yahoo Finance verwenden und die Standardabweichung für alle bereinigten Schlusskurse seit dem 3. Januar 1950 berechnen. Wenn ich die Daten in Stata herunterlade und den Befehl summarize
anwende, erhalte ich:
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
adjclose | 5892 973.4622 376.8612 295.46 1667.47
Das Problem
Wie Sie wahrscheinlich sehen können, machen diese Zahlen jedoch nicht viel Sinn. Wenn wir uns die Daten ansehen, können wir erkennen, dass der S&P 500 seit November 1992 nicht mehr in der Nähe von 424,4896 gehandelt hat. Es ist klar, dass wir nicht davon ausgehen können, dass dieser Mittelwert und diese Standardabweichung repräsentativ für die aktuellen Marktbedingungen sind. Darüber hinaus würden diese Zahlen implizieren, dass der S&P 500 derzeit mit fast drei Standardabweichungen von seinem Mittelwert entfernt gehandelt wird, was für viele Verteilungen ein höchst unwahrscheinliches Ereignis ist. Die Große Rezession, die quantitative Lockerung usw. haben den Markt zwar erheblich verändert, aber nicht in einem so großen Ausmaß.
Das Problem ergibt sich aus der Tatsache, dass Wertpapierpreise in der Regel nicht-stationär sind. Das bedeutet, dass die zugrundeliegende Verteilung, aus der die Wertpapierpreise “gezogen” werden, sich durch Zeit und Raum verschiebt. Zum Beispiel könnten die Preise in den 50er Jahren normalverteilt sein, dann in den 60er Jahren aufgrund eines Schocks gammaverteilt, dann in den 70er Jahren wieder normalverteilt. Dies impliziert, dass die Berechnung von zusammenfassenden Statistiken, z. B. Mittelwert, Standardabweichung usw., für Zeiträume, in denen Preise mehreren Verteilungen folgen könnten, im Wesentlichen bedeutungslos sind.
Lösung
Aus diesem und anderen Gründen ist es üblich, die Standardabweichung von Renditen oder Differenzen anstelle von Preisen zu betrachten.** Die Gründe dafür und verschiedene Vorgehensweisen habe ich in einer anderen Antwort ausführlich behandelt. Kurz gesagt, Sie können die erste Differenz für jede Periode berechnen, die lediglich die Differenz zwischen dem Schlusskurs dieser Periode und dem Schlusskurs der vorherigen Periode ist. Dies wird Ihnen normalerweise einen stationären Prozess liefern, aus dem Sie aussagekräftigere Werte für die Standardabweichung, den Mittelwert usw. erhalten können.
Lassen Sie uns wieder den S&P500 als Beispiel verwenden. Diesmal verwende ich der Einfachheit halber (und um die Diagramme etwas überschaubarer zu machen) jedoch nur Daten ab 1990. Die zusammenfassende Statistik sieht wie folgt aus:
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
adjclose |
D1. | 4618 .2036014 12.09178 -90.16998 91.59003
und das Diagramm sieht so aus; der Mittelwert ist die zentrale horizontale rote Linie, und die obere und untere Linie zeigen jeweils eine Standardabweichung über und unter dem Mittelwert an.
insheet using "http://ichart.finance.yahoo.com/table.csv?s=%5EGSPC&d=4&e=20&f=2013&g=d&a=0&b=3&c=1950&ignore=.csv", comma clear
gen int d = date(date, "YMD")
drop date
rename d date
tsset date, daily
summ adjclose if year(date) > 1989
tsline adjclose if year(date) > 1989, ///
title("Daily adjclose in S&P500, 1990 onwards", size(small)) ///
caption("money.stackexchange.com", size(vsmall) pos(5)) ///
tlabel(01jan1995 01jan2000 01jan2005 01jan2010, labsize(vsmall)) ///
ylabel(, labsize(vsmall)) ///
xlabel(, labsize(vsmall)) ///
yline(973.4622) ///
yline(1350.3234) ///
yline(596.601)
summ D.adjclose if year(date) > 1989
tsline D.adjclose if year(date) > 1989, ///
title("Daily {&Delta}adjclose in S&P500, 1990 onwards", size(small)) ///
caption("money.stackexchange.com", size(vsmall) pos(5)) ///
tlabel(01jan1995 01jan2000 01jan2005 01jan2010, labsize(vsmall)) ///
ylabel(, labsize(vsmall)) ///
xlabel(, labsize(vsmall)) ///
yline(.2036014) ///
yline(12.2953814) ///
yline(-11.8881786)
Wie Sie sehen können, scheint das Diagramm darauf hinzuweisen, dass es lange Zeiträume gab, in denen der Index weit außerhalb dieses Bereichs notierte. Obwohl dies der Fall sein könnte, zeigt die Grafik definitiv einen Trend, zusammen mit einigen scheinbar exogenen Schocks (siehe meine verlinkte Antwort).
Nimmt man jedoch die erste Differenz, so erhält man diese zusammenfassende Statistik:
mit einer Grafik wie dieser:
Das sieht schon viel vernünftiger aus. In Zeiten der Rezession scheint der Preis viel volatiler zu sein, und er durchbricht die im Diagramm angegebenen Linien von +/- einer Standardabweichung.
Dies ist nur eine einfache Zusammenfassung, aber die Verwendung der ersten Differenzierung als Teil des umfassenderen Prozesses des Detrendings/der Dekomposition einer Zeitreihe ist ein guter erster Schritt.
Gleitende Durchschnitte/Bollinger-Bänder
Für einige technische Indikatoren ist die Stationierung jedoch nicht so relevant. Dies ist der Fall bei einigen Arten von gleitenden Durchschnitten und den dazugehörigen Indikatoren. Nehmen Sie zum Beispiel Bollinger-Bänder . Dies sind technische Indikatoren, die eine Anzahl von Standardabweichungen über und unter einem gleitenden Durchschnitt anzeigen. **Wie jede Berechnung der Standardabweichung,Der Analyst wählt eine bestimmte Anzahl von historischen Perioden, z.B. 20, und berechnet den gleitenden Durchschnitt für so viele vorherige Perioden und die gleitende/rollende Standardabweichung für dieselben Perioden. Die Bollinger-Bänder stellen die Werte dar, die zu einem bestimmten Zeitpunkt eine bestimmte Anzahl von Standardabweichungen vom gleitenden Durchschnitt entfernt sind. Zu diesem gegebenen Zeitpunkt können Sie den Wert zwei Standardabweichungen “weg vom Wert” berechnen, aber dazu benötigen Sie immer noch den historischen Aktienkurs (oder zumindest den historischen gleitenden Durchschnitt). Wenn Sie nur den isolierten Kurs erhalten, haben Sie Pech.
Gleitende Durchschnitte können indirekt einige der oben beschriebenen Probleme mit der Stationarität umgehen, weil es einfach ist, eine Zeitreihe mit einem Prozess zu schätzen, der aus einem gleitenden Durchschnitt aufgebaut ist (speziell ein auto-regressiver gleitender Durchschnittsprozess ), aber die Ökonometrie von Zeitreihen ist ein Thema für einen anderen Tag.
Code
Der Stata-Code, den ich verwendet habe, um die Graphen und zusammenfassenden Statistiken zu erzeugen: