ダービンワトソン比

最小自乗法の仮定の一つに,「攪乱項u1, u2,..., uT はそれぞれ独立に分布する」というものがあった。ダービン・ワトソン比(DW) とは,誤差項の系列相関,すなわち,utとut-1 との間の相関の有無を検定するために考案された。

  • これは、時系列データの推定誤差が、自己相関をもつかどうかの判定に使われる。
  • 誤差系列の符号が,+ + + - - - - + + - - - + + のように,プラスが連続で続いた後 で,マイナスが連続で続くというような場合,誤差系列は正の系列相関があると言う。また,+ - + - + - + - +のように交互にプラス,マイナスになる場合,負の系列相関があると言う。
  • 系列相関:正の相関
    DW-positive.JPG
  • 系列相関:負の相関
    DW-negative.JPG

誤差系列に相関がある場合の問題点

誤差項に1 階の自己相関がある場合(ut = ρut−1 +εt)の通常の最小2 乗推定(OLS)には以下のような問題点が生じる。

  • 不偏推定量であるが,最良線形不偏推定量(BLUE)ではない(分散が最小の推定量でない)。ただし,一致性は満たしている。(すなわち,標本数が多くなるほど, パラメータの推定値 が母数と極めてわずかしか離れていない確率が1 に近づく。)
  • 推定値の分散を過小推計する。決定係数R^2を過大評価する。

定義と判定

ダービン・ワトソン比の定義は次の通りである。

DW-ratio.JPG

また次式のように近似計算できる。

DW-ratio2.JPG
  • すなわち,ρハット は utの推定値 とut-1 の回帰係数である。ut = ρ ut-1 + ε において,ut, ut-1 の代わりにその推定値に置き換えて,ρ の推定値ρハットを求める。

パラメータ ρ が 0<ρ<1 の範囲にあれば,ρハット もほぼ同じ範囲にあると考えられるので,DW はほぼ 0 と 2 の間で分布して,帰無仮説のもとでは大きく,対立仮説のもとでは小さくなる.すなわち,DW が2よりも十分に大きい時に、負の系列相関がある。逆に2より十分小さいときには正の系列相関の存在が示唆されることになる。

ダービンワトソン検定

すなわち,ダービン・ワトソン比による検定とは,回帰式が

yt = α + βxt + ut   モデル式
ut = ρ ut-1 + εt    誤差の式
εtは互いに独立。E(εt・εt-i)=0 i=1,2,...

のときに,

H0 : ρ= 0, H1 : ρ> 0または  ρ< 0

の検定である。

  • 判定
    • DW の値が2 前後のとき,系列相関なし( ρの推定値= 0 のとき,DW = 2)。仮説H1:ρ=0を採択する。
    • DW が2 より十分に小さいとき,正の系列相関と判定される。仮説H0:ρ=0を棄却する。ρ>0を採択
    • DW が2 より十分に大きいとき,負の系列相関と判定される。仮説H0:ρ=0を棄却する。
    • DWはダービン・ワトソン比といって、0から4の値をとります。
    • 説明変数に従属変数のラグ付き変数が含まれているときはDW が2 に偏ってしまうため,下記のh 統計量を使わなければな
  • 相関がある場合は、次の状況が考えられる。
    • モデル式が適切でない。非線形性、説明変数や次数が不適切など
    • データが少なすぎる。
    • 除外変数による疑似自己相関が発生している。
    • これらに対応した上で、必要に応じて誤差の系列相関を考慮したモデル式を採用する必要がある。

ダービンのh統計量による検定

説明変数の中にラグ付き被説明変数(被説明変数を Yj としたとき Yj-1)が含まれないときはDW比を用い,含まれるときはダービンのh統計量を用いる.

ダービンのh統計量は次式で定義される。

h = (1-0.5DW値){n/(1-nv)}^(1/2)
ただし、VはYj-1 の係数の分散の推定量
  • yt = α + βxt + γyt-1 + ut のモデル式の場合、VはOLSでこの係数γを推定した場合の推定値の分散の推定値
  • 検定方法 ダービンのh統計量は近似的に標準正規分布 N(0, 1) に従うので,有意水準を10%とすれば
    h<-1.645 のとき,負の自己相関がある.
    -1.645<h<1.645 のとき,自己相関がないという仮説が棄却できない.
    1.645<h のとき,正の自己相関がある.
    • n が十分に大きいとき(n ≥ 30),h 統計量は近似的に標準正規分布に従う。

ExcelでのDW比

DW比を計算するためには残差を求めなければならない。

DW比を求めるために便利なExcel関数として,SUMSQ とSUMXMY2(XマイナスYの2乗和)とがある.SUMSQ 関数は,指定した範囲内のデータの2乗の和を計算し,SUMXMY2 関数は指定した2つの範囲の対応するデータの差の2乗の和を計算するものである.したがって,DW比の分子を計算するために SUMXMY2 関数を用い,分母を計算するために SUMSQ 関数を用いればよい.すなわち,適当なセルに

=SUMXMY2(C28:C41,C27:C40)/SUMSQ(C27:C41)
C28:C41<---utの推定値
C27:C40<---ut-1の推定値
SUMSQ(C27:C41)<---utの分散

という数式を入力すればよい

系列相関がある場合の推定方法

これは、上記のモデルの場合の、観測データ{yt,xt},t=1~nからパラメータ(α,β,ρ)の求める方法について記す。一般には、時系列モデルの式は、いろいろな場合が考えられる。 回帰式が、次の場合を考える。

yt = α + βxt + ut   モデル式
ut = ρ ut-1 + εt    誤差の式
εtは互いに独立。E(εt・εt-i)=0 i=1,2,...

ui を消去する。

yt-ρyt-1=α(1-ρ)+β(Xt-ρxt-1)+εt

であるので

y#t=yt-ρyt-1
x#t=Xt-ρxt-1

と定義して、書き換えれば

y#t=α# + βx#t +εt
α#=α(1-ρ)

となる。

このことから、次の収束計算で最小二乗法を使ってパラメータが求められることがわかる。

  • 1.まず 適当なρ(例えばρ=0)を与えて、y#tとx#tをデータ{yt,xt}から計算。
  • 2.次に、 y#t=α# + βx#t +εt を使ってεtの二乗和を最小にするα#、βをもとめる。これを使って、併せてεtの系列et=y#t-α# + βx#tを計算しその平均、分散、DW比を計算し、誤差系列のチェックを行う。
  • 3.et=ρet+誤差の誤差の二乗和を最小にするρを新たにρハットと置く。
  • 上記のρの推定値ρハットを用いて、1.に戻って、ρを置き換えて収束するまで繰り返す。
  • このように誤差系列に自己相関がある場合は、通常の最小二乗法でなく、2段階以上で最小二乗法を適用する必要が出てくる。

一般化最小二乗法

上記のように、系列相関があるなどして通常の最小二乗法が適用できない場合、多段階で最小二乗法を適用することになるが、これを一般化最小二乗法(GLS:Generalized Least Squares)と呼ぶ。

この方法は、まずOLSを{yt,xt}に適用し、誤差系列を求め、再度誤差系列の最小二乗法から、未知パラメータを求め直すことになる。

ut = ρ ut-1 + εtの平均と分散

上記モデルは、系列相関があり、通常の最小二乗法の最良推定量をえられる条件、utが独立で互いに無相関の条件を満たしていない。では、どのようなutかを説明する。

初期値uoの平均が0、uoとεtは互いに独立と仮定する。誤差項εtも平均0、E(εiεj)=σ^2δijとする。

u1=ρ u0 + ε1
u2=ρ u1 + ε1=ρ^2uo+ρε1+ε2
u3=ρ u3 + ε3=ρ^3uo+ρ^2ε1+ρε2+ε1
・・・・
ut=ρ^t u0+ρ^(t-1)ε1+ρ^(t-2)ε2+...+εt

となるので、この期待値と分散は

E(ut)=0
V(ut)=σ^2/(1-ρ^2)
COV(usut)=σ^2 ρ^(s-t)/(1-ρ^2)

となる。

  • 一般には ρ の絶対値は 1 より小さいものと仮定される.過去の誤差の影響で現在のutが発散しないとの仮定。
  • utの分散は、ρの絶対値が1に近い程、大きくなる。
  • 共分散から、ρ=0でない限り, ut は系列相関をもつ。その分散は時差s-tが大きくなるにつれて指数的に減少していくこともわかる.過去の誤差の影響が無くなる。

参考


添付ファイル: fileDW-negative.JPG 517件 [詳細] fileDW-positive.JPG 515件 [詳細] fileDW-ratio2.JPG 506件 [詳細] fileDW-ratio.JPG 495件 [詳細]

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-09-04 (土) 10:17:00 (2823d)