~第3章~ 共闘! PLAsTiCC 編

(前回までのあらすじ)
調子に乗っていたhmdhmdは、Rコンペでkaggle masterへの道は険しいことを学んだのだった

気をとりなおして、次のチャレンジはPLAsTiCCコンペです。Photometric LSST Astronomical Time-Series Classification Challengeの略称で、日本語のプラスチックとは全く関係ありません。宇宙の情報(光束)を用いて、超新星を分類するという内容です。
これまでHome Credit・Rコンペというヒトの行動ログをもとにしたデータを扱っていましたが、こちらは一転して科学的なデータです。

アプローチ

科学データを扱ったことがなく、そもそもデータに対して何がわからないのかわからない状態だったため、まずはデータがそれぞれどのような意味を持っているのかを調べ始めました。後にも先にも、こんなに宇宙について調べることはないだろう、ぐらいには時間を割いたと思います。

そして自分なりにドメイン知識のイメージが掴めたあとは、とにかく特徴を量産することでスコアを上げていきました。が、終盤でアイデアが枯渇し、途方にくれていました。

チームマージ

そこでtwitter上でチームメンバーを募集をしていたcurrypurinさんhakubishinさんにチームマージしていただくことになりました。

お二方とも私が持っていない知識を持っており、チームマージの恩恵はとても大きかったです。
具体的には、私が見逃していた非常に重要な特徴を教えていただいたり、データをリサンプリングする際に有用なdiscussionを教えていただいたり・・・チームを組むことの偉大さを実感しました。
また、色々と相談しながら進められるということ自体が、とても楽しかったのを覚えています。

結果は1,094チーム中16位で、あと一歩のところで金メダルには届かず・・・。1位になったのはカリフォルニア大学でまさに超新星の研究を専門としている方でした。ドメイン知識が、何かしらの形で役に立ったのでしょう。

また、コンペ後にはオフライン反省会が行われ、そこでも大いに反省する点が見つかって勉強になりました。

hmdhmdは、
・ドメイン知識の重要性を学んだ!
・チームを組むことの偉大さを知った!
・オフライン反省会で大いに反省した!
・銀メダル1枚を獲得し、累計3枚の銀メダルを獲得した!

次回、~第4章~ 意味不明! Eloコンペ 編 に続く

この記事が気に入ったらサポートをしてみませんか?