名無しの研究者のメモ

日頃読んだ資料や面白いと思った情報、日々考えていることを備忘録的にまとめています。 記…

名無しの研究者のメモ

日頃読んだ資料や面白いと思った情報、日々考えていることを備忘録的にまとめています。 記載内容について細心の注意を払っていますが誤情報を含む可能性があります。 当方が所属する一切の団体や組織とは関係ありません。 いいねしてくれると喜びます。フォローしてくれると泣いて喜びます。

最近の記事

ITド素人が2週間でITパスポート合格するまでにやったこと

Hello world!私のITパスポート合格までの記録、勉強時間や勉強方法、使用した参考書などをまとめます。じっくり勉強する時間や気力、やる気はないけどなんとなく資格だけはもっておきたいこれから受験される方のご参考になれば幸いです。 ITパスポート試験を受けるメリット 一般的にITパスポート試験を受けるメリットは、以下のようなものがあります。 - ITに関する基礎的な知識や用語を身につけることができる。これは、IT業界で働くだけでなく、ITを利用する他の分野の仕事でも役

    • 早稲田ビジネススクール合格までに行ったこと

      早稲田ビジネススクールのMBA夜間主総合プログラムを目指し合格しましたのでその記録を備忘録的に記します。これから受験される方のご参考になれば幸いです。※記載している内容は私個人の独断と偏見を含む意見であり所属組織を代表するものではありません。内容は私が受験した当時時点の情報をもとに書いており、将来にわたって正確性を保証するものではありません。あくまで一個人の体験記ですので、予めご了承ください。 準備MBAに行こうと思ったきっかけ  MBAを目指そうと思ったきっかけは現職に

      有料
      300
      • クラスタリング手法:ウォード法、群平均法、最短距離法、重心法、メディアン法の解説

        要約 本レポートでは、クラスタリングに用いられる五つの方法(ウォード法、群平均法、最短距離法、重心法、メディアン法)について、初心者向けにわかりやすく解説します。これらの方法はデータをグループ化する際に用いられ、それぞれ異なる特徴を持ちます。 ウォード法 定義 概要: ウォード法は、クラスター内の分散の増加が最小になるようにデータ点を結合します。 特徴: クラスター内のデータ点が似ている程度を保つことに重点を置きます。 使用場面 適用: バランスの取れたクラスタ

        • ユーグリッド距離、マンハッタン距離、マハラノビス距離の三つの距離測定方法

          ユーグリッド距離、マンハッタン距離、マハラノビス距離の解説 要約 本レポートでは、ユーグリッド距離、マンハッタン距離、マハラノビス距離の三つの距離測定方法を初心者にも理解しやすい形で解説します。これらの距離測定法はデータサイエンスにおいて広く用いられ、データポイント間の関連性や類似性を定量化するのに重要です。 ユーグリッド距離 定義 使用場面 適用: ユーグリッド距離は、直線的な距離が重要な場面、例えば物理的な距離を測る場合に適しています。 マンハッタン距離

        ITド素人が2週間でITパスポート合格するまでにやったこと

          階層クラスター分析と非階層クラスター分析について

          要約 本レポートでは、階層クラスター分析と非階層クラスター分析について詳しく解説します。これらの分析方法はデータのグループ化に用いられ、異なる特徴を持っています。階層クラスター分析はデータを段階的にグループ化し、デンドログラムと呼ばれるツリー構造で表現されます。一方、非階層クラスター分析は事前にクラスター数を定め、データをグループ化します。このレポートでは、両分析法の違い、データ間距離の測定方法(特にユーグリッド距離)、およびクラスター間距離の測定方法(ウォード法や群平均法

          階層クラスター分析と非階層クラスター分析について

          秘密鍵や公開鍵とデジタル署名、公開鍵認証基盤KPIについて

          秘密鍵と公開鍵、デジタル署名、公開鍵認証基盤(PKI):要約 公開鍵と秘密鍵は、暗号化とデジタル署名に使用される一対の鍵です。公開鍵は誰とでも共有可能で、秘密鍵は所有者だけが保持します。デジタル署名は、メッセージの完全性と送信者の認証を保証します。公開鍵認証基盤(PKI)は、これらの鍵とデジタル証明書を使用し、ユーザー間の信頼を確立するシステムです。 第1章:公開鍵暗号と秘密鍵暗号 第1節:公開鍵と秘密鍵の役割 公開鍵暗号化では、公開鍵は暗号化に使用され、秘密鍵は復号

          秘密鍵や公開鍵とデジタル署名、公開鍵認証基盤KPIについて

          k-平均法

          k-平均法(k-means clustering):要約 k-平均法は、データをk個のクラスタに分割することを目的とした教師なし機械学習アルゴリズムです。この方法は、クラスタ内のデータ点の平均(セントロイド)とデータ点間の距離を最小化するようにデータポイントをグループ化します。クラスタリングの結果は初期値に依存するため、異なる初期値を用いて複数回実行し、最も良い結果を選択することが一般的です。 第1章:k-平均法とは 第1節:アルゴリズムの概要 k-平均法は、データを

          主成分分析、次元削減や次元圧縮について

          主成分分析(PCA):要約 主成分分析(PCA)は、多次元データの特徴を捉えつつ次元を減らす統計的手法です。データの分散が最大となる方向を見つけ出し、低次元でデータを表現します。これにより、データの本質的な構造を維持しながら、計算量を減少させたり、データの可視化を可能にします。 第1章:主成分分析(PCA)とは 第1節:PCAの概念 PCAは多次元のデータセットが持つ主要なパターンを発見し、そのデータをより少ない数の変数で表現するために使用されます。これを「次元削減」

          主成分分析、次元削減や次元圧縮について

          教師なし学習と、強化学習の違い

          教師なし学習と強化学習は、機械学習の3つの主要なパラダイムのうちの2つで、教師あり学習がもう1つです。それぞれの学習手法には独自の特徴があり、共通点と相違点があります。 教師なし学習 (Unsupervised Learning) 特徴 ラベルなしデータ: 教師なし学習では、入力データにラベルや報酬が付与されていません。 パターンの発見: 主にデータ内の隠れたパターンや構造を見つけ出すことに重点を置きます。 クラスタリング: データを自然なグループに分けるクラスタリ

          教師なし学習と、強化学習の違い

          ホールドアウト法と交差検証法

          疑問:交差検証法はテストデータ以外のデータセットをランダムに分割し、分割したうちの1個を検証データ、残りのデータを学習データとして用いる方法であり、ホールドアウト法において問題となる偏りのあるデータセットに対して比較的良い性能評価を行うことができる。 とのことですが、ランダムに分割して学習を繰り返すことは交差検証法において必須ですか? ランダムに分割して学習することを1回しかやらなくても交差検証法といえますか? 解答:交差検証法における「ランダムに分割する」というプロセスは

          ホールドアウト法と交差検証法

          k-fold交差検証法

          k-fold交差検証法の解説 要約 k-fold交差検証法は、機械学習においてモデルの性能を評価するための手法です。データセットをk個の部分集合に分割し、そのうちの1つをテストデータとして、残りのk-1個を訓練データとして使用します。このプロセスをk回繰り返し、それぞれ異なる部分集合をテストデータとして用いることで、モデルの汎化能力をより公平に評価することができます。 詳細な説明 交差検証法の必要性 機械学習モデルの性能は、未知のデータに対する予測能力、つまり汎化能

          リフト値、支持度、信頼度

          リフト値、支持度、信頼度の解説 リフト値(Lift)、支持度(Support)、信頼度(Confidence)は、アソシエーション分析やマーケットバスケット分析といったデータマイニングの文脈で用いられる尺度です。これらの指標は、トランザクションデータにおけるアイテム間の関連性を評価するのに役立ちます。 支持度 (Support) 支持度は、全トランザクションのうち、特定のアイテムセットが同時に現れる割合を示します。つまり、全購買データの中で、あるアイテムの組み合わせがど

          リフト値、支持度、信頼度

          間隔尺度と比例尺度

          間隔尺度と比例尺度は、変数の測定における2つの重要な概念です。これらはデータの特性を理解し、適切な統計的手法を選択する際に役立ちます。 間隔尺度 (Interval Scale) 間隔尺度は、等間隔の尺度であり、ゼロ点の位置が絶対的ではない測定尺度です。この尺度は数値データを扱い、算術演算が可能ですが、比率計算(2倍、半分など)は意味をなさない特徴があります。 特徴: 等しい間隔: 隣接する値の間の「差」は一定です。 任意のゼロ点: ゼロは単に基準点であり、実際の非

          スピアマンの順位相関係数について

          要約 スピアマンの順位相関係数は、2つの変数の間の順序の一致度を測定する統計的手法です。通常、記号ρ(ロー)またはrsで表され、データが正規分布に従わない場合や、順序尺度(ランクなど)のデータに対して使用されます。係数の値は-1から+1までの範囲であり、+1は完全な正の相関を、-1は完全な負の相関を、0は相関がないことを意味します。この係数は、データのランクに基づいたもので、個々の値の大きさには依存しません。 スピアマンの順位相関係数の詳細な解説 1. スピアマンの順位

          スピアマンの順位相関係数について

          計画実行と完了をイメージすることが重要

          計画において重要なもの 計画において重要なのは、計画を立てる守るではなく、その計画の実行と完了をイメージすることです。 計画を守るべきもの、従うべきものと考えると、進捗が遅れた際や目標を過達できそうな場合の足かせになります。守るべきものはKPI, KGIとして考えた方が良いだろう。 計画の立て方 1戦略を立てる ゴールイメージを明確に。達成したいことは何かを明確にする 2プロジェクト 具体的なaction plan、何が必要か何が不要かを考える 3プロセス 現在地から

          計画実行と完了をイメージすることが重要

          国債の増発が金利上昇につながるのはなぜですか?

          国債の増発が金利上昇につながるのはなぜですか? 国債の増発が金利上昇につながる主な理由は、供給と需要の関係に基づいて説明できます。以下に詳細を示します。 1. 供給と需要のバランス: 国債は政府が借金をするための証券であり、金融市場に供給されます。増発が行われると、市場における国債の供給が増加します。これに対して、国債を購入する投資家や機関の需要は一定ではありません。供給が需要を上回る場合、価格が下落し、それに伴って金利が上昇する傾向があります。 2. 価格と金利の逆

          国債の増発が金利上昇につながるのはなぜですか?