初心者

はじめてやってみる記事を書いていきます。

初心者

はじめてやってみる記事を書いていきます。

最近の記事

    • 分散の加法性に関する問題(統計検定準1級過去問)

      分散の定義 定理1. X, Yが独立の時 2.  特に1の方を分散の加法性という。 問題(2017年6月 統計検定準1級 問4を少し変形)  あるサンドイッチ工場では2枚のパンと1枚のハムからなるサンドイッチを生産している。サンドイッチの大きさは100[mm]×50[mm]である。原料となるパンとハムは、前工程から次のサイズで送られてくる。 ただし、X, Yはそれぞれ期待値と分散が の確率である。同一のパン内, ハム内での厚さのばらつきは無視してよい。このサン

      • 【Python】NetworkXでさまざまなネットワーク中心性を計算してみた

         ネットワークにおける中心的な頂点を見つけるという問題は、SNSにおける影響力の高い人を見つけたり、数多くの論文の中から重要なものを選んだり、災害発生時にどの現場でもたどり着ける適切な消防施設の場所を決めたりするために重要です。僕は仕事でネットワーク解析をしているわけではないのですが、いつか使うかもしれないと心の準備をしているのと、個人的に興味があったので勉強してみました。 中心性の定義 以下のようにさまざまな定義がある。 ・他の多くの頂点とつながっている頂点 ・その頂点

        • 【Python】ロジスティック回帰の自然勾配降下法

          機械学習の学習アルゴリズムではさまざまな数理最適化が活躍していますが、Takayuki Uchiba先生のロジスティック回帰の自然勾配降下法の記事がとても面白かったのでPythonで真似してみました。 理論的な説明とRでの実装はTakayuki Uchiba先生がして下さっています。 私はこれをPythonに翻訳して再現してみることにしました。 デモデータの生成まずは2次元正規分布に従う乱数を生成します。 ・ラベルy = 1のデータポイントを母平均(1, 1), 母分

          【Python】カテゴリカル変数のone-hot化(sparse)

          処女作です。勉強したいので変なところがあればご指摘くださいmm 機械学習でよく使う前処理であるone-hot化をなるべく省メモリで実行する方法をメモしたいと思い書いてみました。 想定しているのは、1つのカラムに複数のラベルが立つトランザクション形式のデータをone-hot化することで、カテゴリ数は10000個あるとします。 このときぱっと思い浮かぶのはsklearnのMultiLabelBinalizerを使うことですが、sparse_output=Trueを指定するこ

          【Python】カテゴリカル変数のone-hot化(sparse)