[Kaggle] G-Research Crypto Forecastingの上位のSolutionを眺めてみる。
コンペ概要
このコンペティションでは、機械学習を活用して仮想通貨の短期リターンを予測します。2018年以降の高頻度市場データの数百万行のデータセットを使用してモデルを構築する課題です。
下記のようなデータセットが与えられました。
timestamp - 1分間のタイムスタンプ
Asset_ID - 仮想通貨のID
Count - 取引数
Open - 始値
High - 高値
Low -安値
Close -終値
Volume - ボリューム
VWAP - ボリューム加重平均
Target - 15分の残差リターン
コンペティションホストはG-Researchです。
2位
サマリー
2位はNATHANIEL MADDUX氏のソリューションです。
LightGBMのパラメーターのチューニングにはそれほど時間をかけなかったようです。チューニングには時間がかかり、CVの結果からモデルの性能にほとんど影響を与えないことが分かったため、代わりに特徴量エンジニアリングの施策に集中したようです。
3位
サマリー
3位はSUGGHI氏のソリューションです。3位の方はノートブックを公開してくれています。
2位のソリューションも3位のソリューションもLightGBMですね。
他コンペティションでもそうですが、上位のソリューションにLightGBMのモデルをよくみます。