kabuto

データサイエンスで日頃感じたことを書こうと思います

kabuto

データサイエンスで日頃感じたことを書こうと思います

最近の記事

メタバースとは何か?

メタバースの定義前提としてメタバースは現在ではかなり曖昧なもので定義の仕方も多岐に渡るのですが、今のところの個人的な定義は以下です。 verseはuniverseから来ており、universeはひとつの世界つまりは現在の社会を表しています。その上でmetaとはそれを超えたのような意味があります。 したがって現在の社会を超えた何かということがわかります。 現在の社会を完全に模倣したものなら超えていないし、逆に完全に違う空間を作ってしまうと超えたというよりはanother ve

    • ファシリテーションの教科書を読んで

      出典は以下になります。あくまで個人的な解釈からこの記事は書かれています。 はじめに複雑化する社会で意思決定と実行のスピードが求められます。 その中で重要な課題に取り組む必要があります。 その時にするべきは一方的な伝達のトップダウン型の決定だけでなくプロセスの調整が必要になります。 必要なのは仕込みと捌きです。議論で問題になる対立と感情への対処をこれにより行います。 そのプロセスの調整の仕方をこの本からは学ぶことができます。 ①議論の進み方議論は出発点、課題の理由の合意、ア

      • マッキンゼーホッケースティック

        この記事は下記の本を個人的に解釈して書いています。 詳細を読みたい方は以下からお願いします。 はじめに人口減少からの既存市場の縮小とAIなどの技術革新により大胆な戦略立案が必要になっています。 一方で過去の実績は保守的に未来の計画は飛躍するホッケースティック的な計画と度重なる計画の見直しによるヘアリーバック的な成長曲線になりがちではないでしょうか? ホッケースティックとは初期は赤を掘り、Jカーブを描いて成功するPL上の曲線のことを指し、何回も描き直すことで後から見たらPLの

        • Kaggleコンペの流れ-Titanicの上位者から学ぶ- N/Aなど欠損値を対応する【Kaggle チャレンジ2日目】

          はじめに 昨日公式の動画を見て学んでいたですが、ちょっとひと息 実際にブロンズを取った人のやっていることをトレースしてみようと思い立ったのでまとめてみようと思います。 今回トレースするのはこちら コンペの内容はタイタニックの乗客のデータから、生存者の予測をしようというものです。 学習データのカラムは以下です。 ざっくりですが、大きく3段階あるなと思いました。 ①N/Aなど欠損値を対応する ②データセットから目的変数と相関の強い説明変数を探す ③機械学習 ①N/Aなど欠損

        メタバースとは何か?

        • ファシリテーションの教科書を読んで

        • マッキンゼーホッケースティック

        • Kaggleコンペの流れ-Titanicの上位者から学ぶ- N/Aなど欠損値を対応する【Kaggle チャレンジ2日目】

          Kaggleとは何か 【Kaggle チャレンジ1日目】

          KaggleでExpertsを取れるまでの間、考えたことを残そうと思いました。 見てくれる方よろしくお願いします。 Wikipediaによると Kaggle(カグル)は企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。 とあります。 2017年3月8日、GoogleはKaggle社を買収されたようです。 @IT Kaggleはじめの一歩:Kaggle入門という記

          Kaggleとは何か 【Kaggle チャレンジ1日目】

          営業生産性を高めるデータ活用

          この記事は営業生産性を高める! 「データ分析」の技術 (DOBOOKS) (Japanese) Tankobon Softcover – September 1, 2017が元になっています。 営業は定性データも多いですが、取れるデータも多くなってきた中、どのように活用したら良いでしょうか? データが汚い、数が少ない、でも成功する企業はあります。成功しない企業と成功する企業では何が違うのでしょうか? ざっくりですが、私見なサマリー 良い分析は良い分解から始まります。顧客

          営業生産性を高めるデータ活用

          因果関係を考えるには?

          はじめに 相関関係と因果関係は違うという言葉はかなり広がりましたが、因果関係はどのように検証できるかはあまり一般的には知られていないのではないでしょうか? 今回は因果関係を検証するには何をしないといけないのか、何が難しいのかをまとめることができたらと思います。 因果とは何か?なぜ難しいのか?同じ対象が介入を受けた場合の結果変数の値と介入を受けなかった場合での結果変数の値の差があれば、因果があるという。 難しい言葉も含まれていますが、要は歩いたら進むのような、これしたらこうな

          因果関係を考えるには?

          古典的統計アプローチと機械学習アプローチ

          古典的という言葉を用いていますが、機械学習でない統計的アプローチの方が優れるタイミングもあるので、今回はまとめてみました。 今回の記事はアクセンチュアのプロが教える AI時代の実践データ・アナリティクス (Japanese) Tankobon Softcover – August 22, 2020の本が元になっています。 古典的統計・機械学習の使い分けモデルの妥当性や分析結果の解釈を加えるには古典的統計のやり方が優れます。目的変数に対して説明変数がどのように作用しているかが

          古典的統計アプローチと機械学習アプローチ

          日本の人事を科学する

          この記事は日本の人事を科学する 因果推論に基づくデータ活用 (Japanese) Tankobon Softcover – June 15, 2017が元になっています。 人事の領域にもデータサイエンスが活用されるようになってきました。 今回はより実践的な内容を書けたらと思っています。 これまでの人事とこれからの人事これまで人事では経験と勘による運用がされ、多くの人事データは利用されないまま、時には廃棄されてきました。 背景には人事に配属される人が文系出身が多く、統計の知識

          日本の人事を科学する

          データサイエンスものがたり #1 2020年8月〜2021年1月

          ※何を持ってデータサイエンティストであるかの議論は置いといて、こんなやつもいるぞ面白いなー、のテンションで見ていただけると幸いです。 何もわからず始まったデータサイエンス統計分野は大学で少しかじってはいたのですが、ほぼ未経験の状態でした。社長に会社をデータサイエンスが強い会社にしたいと言われ、何もわからず始めました。 数値を扱うの自体はそこまで苦じゃなかったことと、会社のビジネスモデルや色んな業界の動向を見るのは好きだったので、ドメインやビジネスの全体的な理解はOK。データ

          データサイエンスものがたり #1 2020年8月〜2021年1月

          データサイエンスの資料作成術

          データサイエンスにおけるデザインの重要性データサイエンスとデザインは結びつかないかもしれません。 ですが、起こった事象のデータを測定して要素ごとに並べ、グラフを作る理由とは何でしょうか? ひとことで言うなら「何が起こったかわかりやすいから」です。 そして簡単な事象なら良いのですが、色んなものを色んな角度から比較する時どうしてもグラフは複雑なものになってしまうものです。 価値のあるデータを失わせずに読み手や聞き手に伝える、データサイエンスにおけるデザインとはそんな重要性がありま

          データサイエンスの資料作成術

          一人の顧客を起点にしたマーケティング戦略

          この記事は「たった一人の分析から事業は成長する 実践 顧客起点マーケティング」(MarkeZine BOOKS) (Japanese) Tankobon Softcover – April 8, 2019 が元になっています。 まずは私見ばかりですが、サマリです。 デジタル技術がどんどん加速的に発展して複雑化している今、マーケットはリアルタイムで変わります。その時代だからこそ変わる技術ではなく、顧客にスポットを当てたN=1の顧客を徹底的に分析する、N1分析による顧客起点マー

          一人の顧客を起点にしたマーケティング戦略

          データ分析チームの運用の仕方

          以前の記事でデータ分析チームの作り方について書きました。 作り方の方に興味がある方はこちらにお願いします。 https://note.com/paradise_lost/n/n6b3f9093dd92 今回は作ったチーム運営について書きたいと思います。 規模別の分析チーム特徴 規模により特徴や強みが違うため、それをまず知る必要があります。 ①大企業 すでに様々なデータが生成されている点が大きな特徴です。 エクセル、CSV形式データ、スキャンデータ、データベースのデータな

          データ分析チームの運用の仕方

          データ分析チームの作り方

          この記事はデータ分析チームの作り方 (Japanese) Tankobon Hardcover – September 18, 2019が元になっています。 モダンデータサイエンスとは何か? 本書でのデータドリブン企業の定義は、モダンデータサイエンスを活用して、業務を自動化・効率化してコスト削減をする企業とされています。 モダンデータサイエンスとは、2012年頃から急速に発展して来た解析用オープンソースツール群を活用したデータサイエンスを指します。 ここには最近出てきたAI

          データ分析チームの作り方

          データドリブン人事戦略②-運用イメージと落とし穴

          前回の記事でデータドリブンとは何か、運用する上でのポイントは何になるかを書きました。今回はデータドリブンな人事とはどんなものか実例を用いながら運用イメージを書いて見たいと思います。 今回の記事も「データ・ドリブン人事戦略 データ主導の人事機能を組織経営に活かす (Japanese) Tankobon Hardcover – June 19, 2019」が元になっています。Amazonで買えるのでぜひ。 Google中間管理職の検証の事例 これは有名な事例になりましたが、当

          データドリブン人事戦略②-運用イメージと落とし穴

          データドリブン人事戦略①-概要とポイント

          この記事は「データ・ドリブン人事戦略 データ主導の人事機能を組織経営に活かす (Japanese) Tankobon Hardcover – June 19, 2019」が元になっています。Amazonで買えるのでぜひ。 主観だらけですが、ざっくりとしたサマリーです。 データドリブン人事戦略とは企業の競争優位性において適切な人材確保への重要性が高まっています。しかし人事の業務時間の半分以上が管理作業(アドミニ仕事)や法的問題に割かれています。しかし本当にすべきは企業の戦略

          データドリブン人事戦略①-概要とポイント