見出し画像

投資指標と情報係数(IC)などに関するメモ書き

記事の大部分は無料で読めます。有料部分は投げ銭。ありがとうございますと書いてあります。

この記事では記事内で例として紹介している投資指標の算出方法等については公表していません、あしからず。
また、僕の気分により記事を有料化して封印するかもしれませんので、ご了承ください。

mmbot(HFTも含む、以下mmbotで統一)を作成しているうちに利率をもっと高くしたい。予測精度を高めたい。という気持ちが生まれてきた。そのためにはより優秀な投資指標を探したいが、実際のところ数値が高ければつよい(確信)ぐらいの知識しか持っていなかったため、理解を深めるために調べた際のメモ書き
間違っている部分もあると思うのでご容赦ください。あと、間違ってたら教えてください。恥ずかしいので

1. 投資指標(インジケーター)について

投資指標というのはよく名前が上がるものだと移動平均線(MA)だとか、MACDだとか。トレンド系とかオシレーター系とかあるけど今回は関係無いので省略。
mmbotを構築する際に必要なのは数秒後のド短期の価格予測を行うためのもの。
mmboter達は優秀な指標を日々あの手この手で探索していることだろう。

画像1

これは現在僕が構築中のmmbotで実際に使用している指標のとある日の1日分のデータの散布図。横軸は標準化された指標のスコアZで、縦軸はt秒後の値動き(リターン)。
IC = 0.505
R**2 = 0.255
y = 173.08x - 2.5948
で、かなり強い指標だと思う。けどこの数値達は一体何なのだろう。

2. 情報係数(IC)について

IC は Information Coefficientの略。
Information Coefficient (IC) Definition と 
【追加記事】シストレのススメ 3.5.投資指標の探索要領 より。

UKI氏の記事に記載されている通り、情報係数とはリターンと投資指標の相関係数のこと、なので-1から1の間を取る。
相関関係についてざっくりいうと、例えば最小値-1,最大値1の説明変数x郡と目的変数y郡の2変数がある場合。

・相関がある場合
xが1に近づくほどyも1に近い値を取り、xが-1に近づくほどyも-1に近い値を取る。
・逆相関の場合
xが1に近づくほどyは-1に近い値を取り、xが-1に近づくほどyは1に近い値を取る。
・相関が無い
xが-1,0,1という値を取ったとしてもyは0.3,-0.4,0.5のように全く関係のない値を取る。

情報係数の話に戻すと

スコアZがプラス  → t秒後に価格上昇
スコアZがマイナス → t秒後に価格下落

という関係(もしくはその逆)がどれぐらい説明出来るのかというのが情報係数の値となる。
ここで重要なのが、価格が上がる下がるのみに着目した場合は全く相関の無い投資指標を用いても50%の確率で当てられてしまうという部分。
50%の確率で当てられても、結局ランダムにエントリーしているのと変わりがないため、いつか破綻するのは目に見えている。

で、実はICの値から大体何%で上下が当てられるのかというのが分かる。
※ 下記の計算式を間違えていたため直しました。

画像2

ProportionCorrectというのは投資家の予測精度のこと、ここでは投資指標の予測精度として扱う。この方程式をICが分かっている体で並び替えると

画像3

となる。例えばこの方程式に僕の投資指標を当てはめてみると

(0.50453498+1)/2 = 0.752267...

75.2%の確率で上下の値動きを予測出来るということになる。
つまり…情報係数(IC)の値は高いほうがつよい
この式に全く相関の無い指標(IC = 0)を当てはめれば

(0 + 1)/2 = 0.5

となり、テキトーでも50%は予測出来ているのが分かる。

ちなみに、UKI氏の記事によるとICの値が0.05で優秀。0.1で非常に優秀とのこと。予測精度に直すと52.5%と55%になりますね。

3. 決定係数と単回帰分析

まず、決定係数は相関係数の2乗から算出できる。僕の指標でいうとR**2 = 0.255が決定係数にあたる。
この決定係数が何かという前に単回帰分析について説明。
単回帰分析というのは1つの説明変数xの値を使って1つの目的変数yを予測するというもの。

画像4

これは上のほうに貼られてる図とほぼ同じだけど、分かりやすいように単回帰分析のみ赤色の点線で表示したもの。

画像5

要は一次方程式の形でyを予測しているということ。当然予測なため、散布図を見れば分かる通り必ずこれに当てはまってるわけではないです。
例でいくと、スコアZが1ならば、次のt秒で約170円の上昇。スコアZが-1ならば次のt秒間で175.7円の下落が予測出来ているということになる。

ここで決定係数に戻る。決定係数というのはその単回帰分析による予測がどれぐらい説明できるのかという値。
決定係数は相関係数の2乗のため、0から1の値を取る。これはそのまま割合として機能する。
つまり、この指標の場合は目的変数yを説明変数xの値で予測する場合、25.5%が173.08x -  2.5948で説明出来ているということになる。

4. まとめ

かなり端折ったまとめ
・情報係数とは
投資指標の優秀さを表した数値。高いほど価格の上下の予測精度が高い。
・単回帰分析とは
投資指標のスコアから価格がいくら動くか予測できる一次方程式。
・決定係数とは
単回帰分析の予測精度を表した数値。

5. ありがとうございます

ここから先は

11字

¥ 2,000

この記事が気に入ったらサポートをしてみませんか?