見出し画像

[実行用プログラム公開] コピペだけで実用的かつ実践的な説明変数間の独立性を考慮した単純ベイズ (Naïve Bayes, NB) 分類器 (半教師あり学習によるクラス分類) (Python言語)

仕事や研究において、説明変数間の独立性を考慮した単純ベイズ (Naïve Bayes, NB) 分類器をする方もいらっしゃると思います。NBでは推定値の信頼性も考慮できます。独立成分分析 (Independent Component Analysis, ICA) とNBを組み合わせた方法 (ICANB) の実用的かつ実践的な方法はこちらに書きました。

http://univprof.com/archives/16-08-04-5268305.html

しかし、ICANBのやり方はわかっても、実際にICANBができるようになるわけではありません。ネットでICANBのプログラミングを説明しているページはいくつもありますが、実際に自分の手でICANBを行うには、いくつものページを調べる必要があり一手間かかります。

そこでコピペするだけでICANBを実行可能なプログラムを作りました。

データ形式・必要なソフトウェア

以下の記事に示す形式のデータ(data.csv, data_prediction1.csv, data_prediction2.csv)さえ準備すれば、Python言語でICANBが可能です。なおdata.csv, data_prediction1.csv, data_prediction2.csvのすべての説明変数データを使用してICAをおこないます。

Python言語のために必要なソフトウェアは以下の記事をご覧ください。

実行結果

実行結果を下に示します。サンプルごとの予測値が” PredictedY2.csv”というファイルに、サンプルごとの信頼度(各クラスの確率)が” PredictedY2_Probability.csv”というファイルに保存されます。

ICANBからスタートしてさらにプログラミングを進めたいと考えている方にもぜひ利用していただければと思います。

プログラム公開

Python言語のプログラムは有料コンテンツとします。ただこれにより、こちらに記載したICANBをすぐに実行できます。

http://univprof.com/archives/16-08-04-5268305.html

こちらからプログラムのzipファイル自体はダウンロードできます。

http://univprofblog.html.xdomain.jp/code/icanb_analysis_all_python.zip

購入していただくと解凍のためのパスワードがありますのでそちらをご利用ください。

またこちらのzipファイルに必要なスクリプトと関数があります。パスワードはかけていません。購入後に使い方の説明があります。

http://univprofblog.html.xdomain.jp/code/supportingfunctions.zip

すべて動作保証ずみですのでご安心ください。上のデータ形式に合わせていただければ、どんなデータにも使えるプログラムです。このプログラム一つでいろいろなデータを解析することができ、余裕で元が取れます。ご不明点などありましたら遠慮なくこちらに連絡をください。

http://ask.fm/univprofblog1

続きをみるには

残り 403字

¥ 1,000

期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?