時系列解析メモ
はじめに
時系列解析について、簡単にメモ。
時系列(time series)とは
- 時間の経過で変動する何かの数値の列
- 例:気象データ、株価、など
- 時系列解析は、このデータを統計解析すること
時系列の分類
時系列解析の目的
以下のようなことをやりたい。
- description
- 図示や時系列の特徴を簡潔に表現
- modeling
- 時系列の変動を表現するモデルの構成・解析、パラメータ推定
- prediction
- 今後の変動の予測、シミュレーション
- extraction
- 必要な情報の抽出
非定常性のあるデータの扱い
前処理をするか、直接扱うか。
前処理
- 変数変換
- 対数変換(値の増加で変動の大きさも増えるような場合)
- z_n = log(y_n)
- Box-Cox変換
- z_n = λ^{-1} ({y_n}^λ -1) (λ≠0のとき)
- z_n = log(y_n) (λ=0のとき)
- (パラメータλの推定は、AICを使うなどして推定)
- ロジット変換(確率や割合のような(0,1)の範囲を(-∞,∞)の範囲にする)
- z_n = log(y_n/(1-y_n))
- 対数変換(値の増加で変動の大きさも増えるような場合)
- 差分
- 差分(トレンド、傾きを含むような場合、それらを取り除くことができる)
- z_n = y_n - y_{n-1}
- 1周期分の差分(月周期・年周期性を持つ場合など)
- z_n = y_n - y_{n-p}
- 対数値の差分(volatility分析などで用いられる)
- z_n = log(y_n) - log(y_{n-1})
- 差分(トレンド、傾きを含むような場合、それらを取り除くことができる)
- 前年比・前年同期比
- 前年比(yがトレンド*ノイズのような場合、それぞれを分離できる。トレンド:長期的傾向変動)
- z_n = y_n / y_{n-1}
- 前年同期比
- z_n = y_n / y_{n-p}
- 前年比(yがトレンド*ノイズのような場合、それぞれを分離できる。トレンド:長期的傾向変動)
- 移動平均
直接扱う
各非定常性を考慮した時系列モデルを使う。
定常時系列の自己相関関数
- 自己共分散
- 時系列の変動の特徴をとらえるために、y_nとy_{n-k}との共分散を考える
- Cov(y_n, y_{n-k})
- 自己共分散関数
- C_k = Cov(y_n, y_{n-k})
- k: ラグ
- 自己相関関数
- R_k = C_k / C_0
- 定常分布を仮定すると、y_nとy_{n-k}の相関係数において、それぞれの分散がC_0なので
- R_k = C_k / C_0
サンプリング自己相関関数
定常時系列{y_1,...,y_n}が与えられたとき、
- 標本平均 = 1/n * Σy
- 標本自己共分散関数 = 1/n * Σ(y_n-標本平均)*(y_{n-k}-標本平均)
- 標本自己相関関数 = 標本自己共分散関数_k / 標本自己共分散関数_0
自己相関をグラフ(コレログラム)にプロットすることで、変動の特徴(周期性やトレンドなど)も見ることができる
(定常分布ならkの増加で急速に0に収束する)
時系列モデル
以下のようなモデルが研究されている。
ARモデル
- m次の自己回帰モデル
- 過去の値とノイズだけで表現
- y_n = Σ_{i=1}^{m} a_i * y_{n-i} + v_n
- v_n: 白色ノイズ
- パラメータ推定法
- Yule-Walker法
- Levinson's Algorithm
- 最小二乗法
- PARCOR(偏自己相関係数,partial autocorrelation coefficient)法
- Yule-Walker法
多変量ARモデル
- ARモデルを多変量時系列に拡張したもの
時変係数ARモデル
- 変動の仕方が時間とともに変化する非定常時系列に対して、係数が時間とともに変化するARモデル
- y_n = Σ_{j=i}^{m} a_{ni} * y_{n-j} + v_n
MAモデル
- 移動平均モデル
- y_n = Σ_{i=1}^{l} b_i * v_{n-i}
- b_i: モデルのパラメータ
- y_n = Σ_{i=1}^{l} b_i * v_{n-i}
ARMAモデル
- 自己回帰移動平均モデル
- ARモデルとMAを組み合わせたモデル
- y_n = Σ_{i=1}^{m} a_i * y_{n-i} + Σ_{i=1}^{l} b_i * v_{n-i} + v_n
- パラメータ推定法
- カルマンフィルタ
ARIMAモデル
- 自己回帰和分移動平均モデル
- 平均値などが時間によって変動する場合などはよくあるので、時系列の差分を考えARMAモデルを適用したもの
- 非定常な時系列の一つを扱える
SARIMAモデル
- 季節性(z_n==z_{n-p}を近似的に満たす)を考えたARIMAモデル
ARCHモデル
- 分散自己回帰モデル
- 分散不均一性(変動率が時期によって異なった水準を示す)を示すデータへ対応
GARCHモデル
- 一般化ARCHモデル
参考
- 北川,時系列解析入門,岩波書店
- http://en.wikipedia.org/wiki/Time_series