前回、次回はツール作成をすると書きましたが、まずその前に考慮しなければならない内容がありました。
それは株価を目的変数、時間を説明変数として重(この場合は単かな?)回帰分析を行った場合に、回帰分析では一次式で近似されるため、放物線や波動形の近似が出来ないのです。そこで近似式の次元を高次にする考えが思い浮かぶのですが、高次にするとカーブフィッティングという問題が浮上します。特に波動を捉える場合には(取得するデータの期間によりますが)次元を20次元以上にしないとうまく捉えられませんでした。つまりY=aX+bというような式であると仮定しているのが問題であってY=Asin(X1)+Bcos(X2)+cX3+dという式になるはずだと初めから仮定して計算させる必要がありそうです。しかしこのような解析手法を私は知らないのです。
現在、私が把握している手法でこの問題を解決するには重回帰分析の2次元か3次元を使用して、目的変数を株価、説明変数を時間ではなく、別のさまざまな要因として分析する手法があるのではないかと思いました。
例えば小泉景気で株価が上昇した場合は「内閣支持率」や「外資系動向(主に海外に人気が出たから)」などに係る係数の値が上昇していたものと思われます。(最終的には内閣支持率が低下したにもかかわらず株価は上昇したので小泉人気を内閣支持率以外の要因で特定しなければなりませんが)
このようにある特定の状況を説明するのに役立つ情報がどれだけその期間に影響を及ぼしているのかを調べる手法です。よって時間という変数がないため、時間軸に対してデータを適当に入れ替えても答え(近似式)が同じになるという不可思議な現象が起きます。これは仕方のないことです。
この手法の問題点は近似式作成者が、常にその時代その時代の注目されている情報を逐一探してこなければならないところにあります。その情報が株価に全く影響しないというのならば決定係数は異常に低かったりしてうまく回帰しないと思います。とても手動でやる部分が多すぎて実用的ではないのが致命的なのです。