マガジンのカバー画像

しろくまエンジニア

46
運営しているクリエイター

記事一覧

分析は目的ありき

分析は目的ありき



分析は目的ありきです。

「なんとなくデータを見て何か見つけられないか」という作業も「何か」をぼんやりと意識しています。

今回のお話では期末テストで平均80点以上を採るということが目標です。さらにできる限り勉強はしたくありません。この状況下では最低限必要な勉強量を正しく測定する必要があるので、如何にそれを正確に算出するかも重要となってきます。

あの線がちょっとでも急な傾きになると勉強時間は

もっとみる
なぜ分析するのか?第1話

なぜ分析するのか?第1話



データ分析をする以上は目的があります。

なんとなくデータを集めるのではなく、なんとなくデータを見るのではなく

仮説を確認したい・効果を数字で確認したいなど何かの目的があって初めて分析が進みます

そんなお話をわかりやすく漫画にしていきたいと思います

ただ、データを適当に集めまくってマシンの暴力で「えいやっ」とやってしまう分析も面白いな私は考えています。

今回の漫画にはそのテーマは盛り込

もっとみる
テレワークで使える背景を探してみる

テレワークで使える背景を探してみる



エヴァンゲリオンゼーレになれます

D3PTHE・テレワーク

ソフマップ(これでいく勇気はまだない)

その他参考まとめ記事

効果検証入門感想その3〜重回帰〜

効果検証入門感想その3〜重回帰〜

前回は単回帰のお話をしました。

分析したい時に単回帰を使うととても簡単に何でも表現できます。

前回に引き続き例を上げますが

身長を体重から

成績を勉強時間から

餌の小魚の量から、漁獲できるマグロの量を

と、線を引いて表現することが可能です。

でも実際世の中こんなに簡単ではありません。。。。

そう、マグロの漁獲量1つとっても、天候・季節・時間帯・沖からの距離・水温・地域性・わずかなポ

もっとみる
効果検証入門感想その2〜回帰〜

効果検証入門感想その2〜回帰〜

効果検証入門の第2章の感想を描き始めました。

今回はみなさんに回帰が何か伝われば嬉しく思います。

前回はRCT(randomized controlled trial)について話しました。簡潔に言うと、「検証や分析においてサンプルがランダムに選ばれていると言うことは非常に重要である。作為的にサンプルを採取していると正しい効果が検証できず、バイアスが掛かった過剰・不足のある結果が得られてしまう。

もっとみる
「効果検証入門」〜セレクションバイアスとRCT〜感想

「効果検証入門」〜セレクションバイアスとRCT〜感想

交換検証入門がtwitterで話題になっていたので手に取ってみました。

こう見えても理系出身の私、ある程度は理解できるだろうと思って臨みましたが半分は理解できたのかできなかったのか...

記録程度ではありますが、理解したことをメモに残していきます。

効果検証とは?例えばECサイト運用担当者が、顧客に販促メールを送ったとして、

メールによってどのくらいお客様の購買にどのくらい影響を与えたのか

もっとみる
ラグ特徴量で時系列データの精度をあげる

ラグ特徴量で時系列データの精度をあげる



ラグ特徴量とは何か?ラグ特徴量のラグはタイムラグとかのラグと同じです。今の時間の特徴だけに注目せずに過去の特徴を用いて現在のデータの特徴量を増やす方法です。

過去と明言しましたが、未来のデータを使うケースもたまにあります。

しかし、実際には未来のデータを利用するとリークを起こすことがあり、時系列が重視される予測モデルでは過去のデータのみに限定した方が良さそうだというのが私の見解です。

もっとみる
「ITってどうやって覚えたらいいの?」という友達の質問に困る

「ITってどうやって覚えたらいいの?」という友達の質問に困る



俺「何になりたいの?」

同期「そういうのじゃなくて何となく色々知っておきたい」

俺「・・・・あぁ!?(怒)」

ITってどう学べばいいの?今の時代システムは理解しておいた方がいいとは思いますよね。

僕も最初エンジニアを目指した時は3年程度頑張ってみて、そこから進路を決めようと思っていたので、気持ちはよくわかります。

ただこれについては答えはないと思います。

何がしたいの?何になりたい

もっとみる
俺はただLightGBMを動かしてみたかったんだ

俺はただLightGBMを動かしてみたかったんだ



ゼロから作るディープラーニング読んでみたけど...みなさんご存知「ゼロから作るDeep Learning」です。筆者の私は理系のバックグラウンドがあるため、多少四苦八苦しながらも理解できました。

しかし!kaggleで活躍したい!業務に活かしたい!機械学習もっとやってみたい!そこにたどり着くにはこの本を読んだだけでは当然ダメなのです。

とりあえずLightGBM動かしたい詳しい方は突っ込み

もっとみる
kaggle初心者の2ステップ目【ieee】

kaggle初心者の2ステップ目【ieee】



こいつを読んでディープラーニングを完全に理解した私ですが、やはり実践の場に出ると何も役に立ちません。アンサンブルってどうやるんだ???データ拡張ってこれで合ってるのか???もはやReLU関数がどうこうではありません。

恐るべしkaggle...

人のカーネルを参考にして提出するところまではu++先生の記事を読んでやってみました。

ただしせっかちな私は拾い読み。当然画像認識制度を向上させる

もっとみる
速くなりたい!タイピング|しろくまエンジニア

速くなりたい!タイピング|しろくまエンジニア



タイピングって大人になってから直そうとしても癖がついてるし、そのせいで速くならないし、なかなか難しいです。

まだまだ新入社員の私、会社の先輩方に相談してみました。

みんな色んなアドバイスくれました。

・癖なんて気にしなくていいよ、意外とみんなあるから

・遅い原因が癖とは限らないし

・そもそもチャットレベルで打てるなら、そこまで速く打つ必要ってないんじゃない

みんなとっても優しいです

もっとみる
クソコード|しろくまエンジニア

クソコード|しろくまエンジニア



この間コードレビュー会に参加して絶望しました。

どれだけ気をつけてもどれだけ反省しても、気がついたら汚いコードを書いてしまいます。

リーダブルコードをまた読もうと思います。

ニューラルネットワークの基礎、パーセプトロン|しろくまエンジニア

ニューラルネットワークの基礎、パーセプトロン|しろくまエンジニア



先日初学者の「そもそもニューラルネットワークって、どうして使う必要があるの?深層学習の知識のある友人が、「色々あるけれど非線形の分類問題に対応できるからだよ」という説明が感動したので絵にしました。

特徴量として身長、体重のデータがあり、その人の出身が日本かアメリカか分ける問題があるとします。これがくっきりと一本の線を、身長と体重のグラフの中に描けたらいいのですが、そうも行かないと思います。

もっとみる
エンジニアは調査隊!|しろくまエンジニア30

エンジニアは調査隊!|しろくまエンジニア30



自戒の念も込めてですが、新卒の頃はシステムトラブル発生時に「調べてと言われたらまず調べる」状態でした。

しかしこれではいけません。本来コードやログ以外から調べるべきことは山のようにあります。システム担当者だからこそ、それを知っておかなくてはいけません。

調査を依頼してくる側が非エンジニアだと、難しさがわかってなかったり、まずはシステムに投げてみて解決したら嬉しいなと考えているかもしれません

もっとみる