データ形式について

皆さんが市場の取引履歴を見るとき、取引履歴にある情報は

時刻、ID、サイド、価格、出来高、売買代金、tick数

等がある。

ただ、こういった情報だけを集めても分析しづらいので、用途によってデータを整理する必要がある。これをサンプリングという。

ここで紹介する形式の種類は

タイムバー

ティックバー

ボリュームバー

ドルバー

である。

それぞれの形式の長所について紹介したいと思う。

タイムバー:これが一番標準的である。所謂時系列データである。一定時間でデータを区切って、その区間内の情報をまとめる。(始値、高値、安値、終値、出来高など)長所は、時刻が大事になる戦略でこの形式が威力を発揮する。例えば、アービトラージ戦略では主にこういったデータを見ると思うし、アノマリー検知(1月1日になると株価が~、決算後に株価が~、雇用統計出るとドル円が~)では、過去に起きたイベントの時刻とその後の株価の分析をするので、こういった時系列データが強い。

ティックバー:これは一定数のティック内の情報をまとめるものである。考え方は、株価の動きがランダムだとすると、一定の取引をした後の株価変動率が正規分布に従うというものである。そういったことを仮定して、仮説を棄却するような投資戦略では有効かもしれない。例えば、株価が次に上がるか下がるかの確率は50%だと仮定して優位水準を1%下回ったら統計的におかしいとして取引するとする。そこで、10回連続で株価が下がれば、それが起きる確率(p値)は1/(2^10)≒0.1%なので、優位水準を1%を下回って、ここでショートする。こういった戦略ではティックバーは有効であろう。

ボリュームバー:これは一定の出来高(例1000株)毎にデータをまとめるものである。長所は、ティックバーよりも良い統計的性質を保有していることである。例えば、ティックバーでは、1時間で1万株しか取引されていない株で一気に100万株買われてもティック数は変化しないが、ボリュームバーは変化するからである。長所は、ティックバーと比べて株価があまり動かないことである。なので、誰かが取引したら自分も取引するというような戦略(プレデター戦略)では有効である。

ドルバー:これが一番分かりやすいバーである。一定の売買代金(例100万円)毎にデータをまとめるものである。長所は、市場にあるお金は有限だと仮定して、ある大口投資家が一気に板を食べたとする。株価はほとんど変動していないが、投資家の数が一気に減った可能性が高い。つまり、需要が高くなるのである。ドルバーで見ていけば、需給の分析をしやすくなるのである。

この本では、情報ドリブンバーというバーも紹介しているが、ここでは説明を割愛する。理由は、最初で説明した通り、戦略に応じてバーを作れば良いので、いきなり複雑な戦略を考える必要はない。

この記事が気に入ったらサポートをしてみませんか?