記事一覧
Pythonでサクッと株価データをゲットする方法
Pythonを使って株価分析をしてみたい方向けの記事になります。
Pandas Datareaderというライブラリーを使って
サクッと株価データをゲットする方法をご紹介します。
✅ Pandas Datareaderってどんなライブラリー?Pandas Datareaderは、
株価、為替レート、経済指標などのデータを簡単に取得し、
PandasのDataFrame形式で扱うことができるライ
統計検定2級に合格するための最強の学習方法
この記事では、
自分自身の体験をもとに、
統計検定2級の効率的な勉強方法や、
オススメの教材についてご紹介していきます。
これから統計検定2級を勉強しようと考えている方の
参考になれば幸いです。
私の試験結果レポート
ちなみに、トータルの勉強期間は1ヶ月半程度になります。
自分のスペックのご紹介試験勉強を始める前の、数学・統計に対する知識レベルをご紹介します。
数学・統計に造詣があったわけ
【機械学習の初学者向け】不均衡データではRandomUnderSamplerを使ってみよう
機械学習の分類問題では、
陽性クラス・陰性クラスのデータ数に偏りがある
不均衡データによく直面します。
このような不均衡データでは、
モデルが多数クラスの特徴を過剰に学習し、
少数クラスを適切に識別できなくなることで、
性能に悪影響を及ぼします。
特に少数クラスの予測は難しくなります。
この問題に対処するための方法はいくつかあります。
最も手っ取り早いのは、
陽性クラスと陰性クラスの数をな
【機械学習】Pytorchでニューラルネットワークモデルを構築(シンプルなやつ)
機械学習では、
性質の違うモデルを組み合わせることで
高い精度を出すことができます。
このように複数のモデルを組み合わせることを
アンサンブルと言います。
ニューラルネットワークモデル(NNモデル)は、
画像解析や自然言語処理では高い精度を
発揮しますが、
機械学習でよくあるテーブルデータとなると、
精度はイマイチです。
しかしながら、NNモデルも、
アンサンブルの一つとして使うと
高い精度
databricksを使って良かったところ・改善してほしいところ
金融データ活用推進協会(FUDA)主催の機械学習コンペ
「第2回金融データ活用チャレンジ」に参加しました。
このコンペ参加の醍醐味の一つに
有料級のデータ分析ツールを”無料”で使える点があります。
今年は、
・databricks(昨年も使えた)
・dataiku(今年はじめて使える)
・tableau(今年はじめて使える)
の豪華3点ツールの使用ができました。
私自身、金融機関に勤めていま
【機械学習の初学者向け】F1スコアについて理解しよう!
はじめに機械学習モデルの良し悪しを評価する指標にF1スコアがあります。
機械学習を勉強して初めて知る人も多いと思いますが、
初学者にとっては、分かりにくい指標ではないかと思います。
私自身も初学者の領域ですが、
F1スコアについては、よく分かっていませんでした。
このたび、金融データ活用推進協会が主催する
機械学習コンペ「第2回金融データ活用チャレンジ」に参加したところ、
評価指標が「Mean