regonn&curry.fm #36 収録しました


れごんとカレーちゃんがデータサイエンス(主にKaggle)について話すpodcastである、regonn&curry.fmの収録を行いました。

以下から視聴可能です。podcastでも後日公開します。

話した内容

今回のテーマはscrapboxにまとめています。
・強化学習で自動売買
・SIGNATEにフォーラム機能が追加された
・SIGNATEで「データサイエンティスト実態調査」の結果が公表されていた
・作ってわかる! アンサンブル学習アルゴリズム入門が届いた
・今週のtips:コンペの選び方
・今週のkaggle


kaggleのコンペの選び方について

コンペの選び方は、よく聞かれるテーマで、開催中のコンペもその時々で変わるのでとても難しいテーマ。
今回の放送では次のようなことを話しました。

・入門(タイタニックコンペ等でのkaggleの体験)がおわたっら、開催中の参加者が多いコンペに参加して、結果発表までを体験してしまうのが良いと思う。

・参加者が多いコンペは、データが扱い安く入門者もやりやすいことが多いし、Kernelやディスカッションもたくさん投稿されるので、初心者が勉強できる内容も多い。

・Kaggleのコンペは3ヶ月ぐらいの期間が多いが、順位にこだわりがないのであれば最初はコンペ終了まで数週間から1ヶ月ぐらいのコンペに出てしまうのが良いと思う。いきなり3ヶ月ぐらいのコンペに出てしまうと、何をやって良いかわからなくなってしまうこともある。

・今であれば、テーブルデータは、若干のクセがあるものの、Instant Gratificationコンペがおすすめ。画像データのコンペは数日から1週間程度で終わるコンペが多い。

終わりに

これまで、regonn&curry.fmについて、あまり文字にしていませんでしたが、これからはnoteでもこのように書いていきたいと思います。

コメントお待ちしています。匿名の質問はマシュマロから→https://marshmallow-qa.com/currypurin