Yuro

Osaka or Kyoto

Yuro

Osaka or Kyoto

記事一覧

How to study Duolingo English Test to get 120.

1) The reasons why I took DET Doulingo English Test (DET) has become more common in recent years even though many people tend to take IELTS or TOEFL. I took IE…

Yuro
1か月前
2

Type1 error/Type2 error

Type1 error(第一種の誤り) 定義: 帰無仮説が真実の場合に、誤って帰無仮説を棄却する誤り。 例: ある薬が効果がない(帰無仮説)と仮定した場合、テストの結果、この…

Yuro
8か月前

サンプルサイズの大きさとp値の関係

Yuro
9か月前

”順序”ロジスティック回帰

①ロジスティック回帰の位置付け →多変量解析におけるデータから予測に入ると思う。重回帰分析との棲み分けは次に述べる。 ②多変量解析における重回帰分析と何が違うか…

Yuro
11か月前

分布の違い

どのような違いがあるか。確かに、t分布と正規分布、F分布とカイ二乗分布はそれぞれ似ている特性を持っています。しかし、これらの各分布は独自の特性と適用範囲を持ってお…

Yuro
1年前
1

各要因の影響や、要因の組み合わせの影響を確かめる。(手段として交互作用項を導入し重回帰分析を使う)

Plan & Do【解答】 もちろんです。 まず、必要なライブラリをインポートします: import pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as s…

Yuro
1年前
1

続:クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

【解答】 1:3群に差があるか?に対する問い: 「p値を出すために、クラスカル・ワリス検定をすればできる」 → はい、その通りです。クラスカル・ワリス検定は、3つ以上の…

Yuro
1年前

クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

大学院で頑張る友人へタイトルの件、1〜4章(PDCA)をChatGPTと一緒に整理した。 そんなに大層な内容ではないけど、参考になれば嬉しい。 1章:やりたい分析とコード・・…

Yuro
1年前
4

どう単位を取ったか?【入門微分積分('22) - 放送大学】

掲題のクエスチョンに対する意見授業期間中に、中間テスト、課題型問題、教科書の演習に注力する。 そのために、2ヶ月ほどで15回分の放送を見終える。 以降は、「単位を取…

Yuro
1年前
3

どう単位を取ったか?【入門線型代数('19) - 放送大学】

掲題のクエスチョンに対する意見入学前に、範囲内の演習を1周することが有効。 例えば、23年4月から受講を考えている人は、入学前の2月〜3月は予習に使えるといいかもしれ…

Yuro
1年前
6

【Data analytics】片対数グラフを使う

1. 対数を取るグラフとは軸のスケールに対数をとること(片対数グラフや両対数グラフを使うこと)で、指数関数的に増減するデータに対して可視性を高めることができ、 示唆…

Yuro
1年前
1

【Data analytics】p値とどう付き合っていくべきか(part1)

0. 本記事のスコープpart1では、p値の問題点を提起した上で、p値はどのような特徴を持っているのか確かめます。p値以外のアプローチについては、次回以降(part2)の記事で…

Yuro
2年前

【cloud入門】難しい言葉をわかりやすくするのにトライ

So what 1 : クラウドサービスを使う Amazon / Microsoft 365 / Youtubeのような大量のユーザを支えるインフラと同等のものを使う So what 2 : 管理コンソールで操作す…

Yuro
2年前
1

【Data analytics】SEMによって、満足度の要因分析にトライ

What/Why is SEM? SEM(別名:共分散構造分析、構造方程式モデリング)は因果関係を説明する上でとても有効な分析手法です。細かな説明はアイシアさんの動画がわかりやすい…

Yuro
2年前
2

【Data analytics】Rで因子分析(Factor Analysis)・クロンバックα算出を試みる

なんでやるの? 因子分析はデータの裏側にある共通した因子を見つけるため。これにより、新たな軸ができるイメージ。軸出しはマーケティングなどで活かそうです(最後の方…

Yuro
2年前
3

ビルゲイツの読書ルールを4点

1. 1年で50冊  (Read 50 books in a year) 2. ノートを取る  (Take a note) 3. 1回の読書は1時間以上  (Reading is at least one hour at a time) 4. 最…

Yuro
3年前
2
How to study Duolingo English Test to get 120.

How to study Duolingo English Test to get 120.

1) The reasons why I took DET

Doulingo English Test (DET) has become more common in recent years even though many people tend to take IELTS or TOEFL. I took IELTS three times in the year of 2023, but

もっとみる
Type1 error/Type2 error

Type1 error/Type2 error

Type1 error(第一種の誤り)

定義: 帰無仮説が真実の場合に、誤って帰無仮説を棄却する誤り。

例: ある薬が効果がない(帰無仮説)と仮定した場合、テストの結果、この薬が効果があると誤って判断すること。

P値: 第一種の誤りの確率は、通常α(アルファ)として示され、これはしばしば0.05と設定されます。つまり、5%の確率で第一種の誤りを犯すリスクがあるということ。

Type2 er

もっとみる
”順序”ロジスティック回帰

”順序”ロジスティック回帰

①ロジスティック回帰の位置付け
→多変量解析におけるデータから予測に入ると思う。重回帰分析との棲み分けは次に述べる。

②多変量解析における重回帰分析と何が違うか?
→予測値の取る範囲が定まるもの=ロジスティック回帰?
→定まらないもの=重回帰分析?

③順序ロジスティック回帰とは?
→目的変数が2値ではなく3値以上を取る時に活用する回帰分析
→(取る値の数ー1個)のロジスティック回帰を作ることが

もっとみる
分布の違い

分布の違い

どのような違いがあるか。確かに、t分布と正規分布、F分布とカイ二乗分布はそれぞれ似ている特性を持っています。しかし、これらの各分布は独自の特性と適用範囲を持っており、そのためには重要な役割を果たしています。特に、統計的推定と仮説検定の文脈でそれらは頻繁に使われます。

正規分布とt分布: 正規分布は、中心極限定理により、大数の法則により平均値が正規分布に従うとされています。しかし、実際のデータ分析

もっとみる
各要因の影響や、要因の組み合わせの影響を確かめる。(手段として交互作用項を導入し重回帰分析を使う)

各要因の影響や、要因の組み合わせの影響を確かめる。(手段として交互作用項を導入し重回帰分析を使う)

Plan & Do【解答】
もちろんです。
まず、必要なライブラリをインポートします:

import pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as smf

次に、DataFrameを作成します:

# データの準備data = { "joint_type": [1, 2, 3, 1, 2

もっとみる
続:クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

続:クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

【解答】
1:3群に差があるか?に対する問い:
「p値を出すために、クラスカル・ワリス検定をすればできる」
→ はい、その通りです。クラスカル・ワリス検定は、3つ以上の群間での中央値の差異を検証するための非パラメトリックな手法です。この検定により、p値が得られ、それにより群間に統計的に有意な差があるかどうかを判断することができます。

2:どのくらい差があるか?に対する問い:
「効果量を出すために

もっとみる
クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

大学院で頑張る友人へタイトルの件、1〜4章(PDCA)をChatGPTと一緒に整理した。
そんなに大層な内容ではないけど、参考になれば嬉しい。

1章:やりたい分析とコード・・・Plan・Do

【解答】
まず、Pythonでクラスカル・ワリス検定を行う方法を説明しましたが、その際の信頼区間を求めるには、クラスカル・ワリス検定自体がパラメトリックなテストではなく、特定のパラメータ(例えば平均や分散

もっとみる
どう単位を取ったか?【入門微分積分('22) - 放送大学】

どう単位を取ったか?【入門微分積分('22) - 放送大学】

掲題のクエスチョンに対する意見授業期間中に、中間テスト、課題型問題、教科書の演習に注力する。
そのために、2ヶ月ほどで15回分の放送を見終える。

以降は、「単位を取りたかった理由」「授業をマスターするために大事にしていた心得」「勉強方法」「結果」「振り返り」「2023年春セメスターの目標」「ネクストアクション」を書き下した。
受講を検討している方の参考になれば嬉しい。

単位を取りたかった理由

もっとみる
どう単位を取ったか?【入門線型代数('19) - 放送大学】

どう単位を取ったか?【入門線型代数('19) - 放送大学】

掲題のクエスチョンに対する意見入学前に、範囲内の演習を1周することが有効。
例えば、23年4月から受講を考えている人は、入学前の2月〜3月は予習に使えるといいかもしれない。

以降は、「単位を取りたかった理由」「授業をマスターするために大事にしていた心得」「勉強方法」「結果」「振り返り」「2023年春セメスターの目標」「ネクストアクション」を書き下した。
受講を検討している方の参考になれば嬉しい。

もっとみる
【Data analytics】片対数グラフを使う

【Data analytics】片対数グラフを使う

1. 対数を取るグラフとは軸のスケールに対数をとること(片対数グラフや両対数グラフを使うこと)で、指数関数的に増減するデータに対して可視性を高めることができ、
示唆を出しやすく(例:増加率が上下したなど)なります。

その参考となる資料(サイトやYoutube)を3つ紹介します。

”片対数グラフ・両対数グラフとは?ー分かりやすく解説”(Youtube)

そもそもデータをグラフ化する目的って何だ

もっとみる
【Data analytics】p値とどう付き合っていくべきか(part1)

【Data analytics】p値とどう付き合っていくべきか(part1)

0. 本記事のスコープpart1では、p値の問題点を提起した上で、p値はどのような特徴を持っているのか確かめます。p値以外のアプローチについては、次回以降(part2)の記事で述べる予定です。

1. p値に関する問題点 ー思ったよりも簡単にp値ハッキングができるー研究やビジネスの意思決定において、p値のハッキング(p値が設定した有意水準を下回るように操作すること)が問題となっています。
その問題

もっとみる
【cloud入門】難しい言葉をわかりやすくするのにトライ

【cloud入門】難しい言葉をわかりやすくするのにトライ

So what 1 : クラウドサービスを使う

Amazon / Microsoft 365 / Youtubeのような大量のユーザを支えるインフラと同等のものを使う

So what 2 : 管理コンソールで操作する

ブラウザで表示されるクラウドの画面から操作する

So what 3 : ゾーンを分けて冗長化する

複数のサーバを他の拠点に構築して(ゾーンを分けて)、ある拠点が停電など

もっとみる
【Data analytics】SEMによって、満足度の要因分析にトライ

【Data analytics】SEMによって、満足度の要因分析にトライ

What/Why is SEM?
SEM(別名:共分散構造分析、構造方程式モデリング)は因果関係を説明する上でとても有効な分析手法です。細かな説明はアイシアさんの動画がわかりやすいです。SEMで使われている方程式の正体や具体例が丁寧に説明されています。

前提の確認(使う言語・使うデータ)【使うツール】
私は学生時代に、「消費者はなぜ000を使うのか/使い続けるのか/人に推奨するのか」を心理に着目

もっとみる
【Data analytics】Rで因子分析(Factor Analysis)・クロンバックα算出を試みる

【Data analytics】Rで因子分析(Factor Analysis)・クロンバックα算出を試みる

なんでやるの? 因子分析はデータの裏側にある共通した因子を見つけるため。これにより、新たな軸ができるイメージ。軸出しはマーケティングなどで活かそうです(最後の方で、因子分析の応用例に触れられています→AiciaさんYoutube)。

 クロンバックα算出は信頼性の確認のため。変数の調査とそれに紐づく質問を用意する際、本当にその質問でいいのか、信頼できるのか?この問いに答えるべく、統計処理を行い、

もっとみる

ビルゲイツの読書ルールを4点

1. 1年で50冊  (Read 50 books in a year)

2. ノートを取る  (Take a note)

3. 1回の読書は1時間以上  (Reading is at least one hour at a time)

4. 最後まで読む  ( Finish every book you read)