時系列解析メモ

はじめに

時系列解析について、簡単にメモ。

時系列(time series)とは

  • 時間の経過で変動する何かの数値の列
    • 例:気象データ、株価、など
  • 時系列解析は、このデータを統計解析すること
時系列の分類
  • 連続時間・離散時間
    • 時間間隔が連続的か、離散的(1時間おき、とか)か
  • 1変量・多変量
    • 1つの情報だけか、同じ時間の2つ以上の情報が与えられるか
  • 定常・非定常
    • 時間的に変化しない確率モデルの実現値とみなせる(定常)か、そうでないか
      • 弱定常: 分布がl時間(シフト)後と同じになるようなもの
      • 強定常: 分布が時間(シフト)に対して不変になるようなもの
  • ガウス型・非ガウス
    • 時系列の分布が正規分布に従うか、そうでないか
  • 線形・非線形
    • 線形なモデルの出力として表現できるか、そうでないか
時系列解析の目的

以下のようなことをやりたい。

  • description
    • 図示や時系列の特徴を簡潔に表現
  • modeling
    • 時系列の変動を表現するモデルの構成・解析、パラメータ推定
  • prediction
    • 今後の変動の予測、シミュレーション
  • extraction
    • 必要な情報の抽出

非定常性のあるデータの扱い

前処理をするか、直接扱うか。

前処理
  • 変数変換
    • 対数変換(値の増加で変動の大きさも増えるような場合)
      • z_n = log(y_n)
    • Box-Cox変換
      • z_n = λ^{-1} ({y_n}^λ -1) (λ≠0のとき)
      • z_n = log(y_n) (λ=0のとき)
      • (パラメータλの推定は、AICを使うなどして推定)
    • ロジット変換(確率や割合のような(0,1)の範囲を(-∞,∞)の範囲にする)
      • z_n = log(y_n/(1-y_n))
  • 差分
    • 差分(トレンド、傾きを含むような場合、それらを取り除くことができる)
      • z_n = y_n - y_{n-1}
    • 1周期分の差分(月周期・年周期性を持つ場合など)
      • z_n = y_n - y_{n-p}
    • 対数値の差分(volatility分析などで用いられる)
      • z_n = log(y_n) - log(y_{n-1})
  • 前年比・前年同期比
    • 前年比(yがトレンド*ノイズのような場合、それぞれを分離できる。トレンド:長期的傾向変動)
      • z_n = y_n / y_{n-1}
    • 前年同期比
      • z_n = y_n / y_{n-p}
  • 移動平均
    • 移動平均(変動を滑らかにできる)
      • z_n = 1/(2k+1) * Σ_{j=-k}^{k} y_{n+j}
    • 重み付き移動平均
      • z_n = Σ_{j=-k}^{k} ω_j * y_{n+j}
      • Σ_{j=-k}^{k} ω_j=1, ω_j>=1
    • 移動メディアン
      • z_n = median{y_{n-k},...,y_n,...,y_{n+k}}
直接扱う

各非定常性を考慮した時系列モデルを使う。

定常時系列の自己相関関数

  • 自己共分散
    • 時系列の変動の特徴をとらえるために、y_nとy_{n-k}との共分散を考える
    • Cov(y_n, y_{n-k})
  • 自己共分散関数
    • C_k = Cov(y_n, y_{n-k})
    • k: ラグ
  • 自己相関関数
    • R_k = C_k / C_0
      • 定常分布を仮定すると、y_nとy_{n-k}の相関係数において、それぞれの分散がC_0なので
サンプリング自己相関関数

定常時系列{y_1,...,y_n}が与えられたとき、

  • 標本平均 = 1/n * Σy
  • 標本自己共分散関数 = 1/n * Σ(y_n-標本平均)*(y_{n-k}-標本平均)
  • 標本自己相関関数 = 標本自己共分散関数_k / 標本自己共分散関数_0

自己相関をグラフ(コレログラム)にプロットすることで、変動の特徴(周期性やトレンドなど)も見ることができる
(定常分布ならkの増加で急速に0に収束する)

時系列モデル

以下のようなモデルが研究されている。

ARモデル
  • m次の自己回帰モデル
    • 過去の値とノイズだけで表現
    • y_n = Σ_{i=1}^{m} a_i * y_{n-i} + v_n
      • v_n: 白色ノイズ
  • パラメータ推定法
    • Yule-Walker法
      • Levinson's Algorithm
    • 最小二乗法
    • PARCOR(偏自己相関係数,partial autocorrelation coefficient)法
多変量ARモデル
  • ARモデルを多変量時系列に拡張したもの
局所定常ARモデル
  • 非定常な時系列について、時間を小区間に分割しそれぞれの区間内では定常と仮定する
時変係数ARモデル
  • 変動の仕方が時間とともに変化する非定常時系列に対して、係数が時間とともに変化するARモデル
    • y_n = Σ_{j=i}^{m} a_{ni} * y_{n-j} + v_n
MAモデル
  • 移動平均モデル
    • y_n = Σ_{i=1}^{l} b_i * v_{n-i}
      • b_i: モデルのパラメータ
ARMAモデル
  • パラメータ推定法
    • カルマンフィルタ
ARIMAモデル
  • 自己回帰和分移動平均モデル
  • 平均値などが時間によって変動する場合などはよくあるので、時系列の差分を考えARMAモデルを適用したもの
  • 非定常な時系列の一つを扱える
SARIMAモデル
  • 季節性(z_n==z_{n-p}を近似的に満たす)を考えたARIMAモデル
ARCHモデル
  • 分散自己回帰モデル
  • 分散不均一性(変動率が時期によって異なった水準を示す)を示すデータへ対応
GARCHモデル
  • 一般化ARCHモデル

その他の話題

参考