ビッグデータ時代の到来?! 最近耳にする 「データマイニング」とは?【179】

近年、スマートフォンの普及などにより我々の生活に欠かせないものとなった「インターネット」。それが学校の授業や、会社の仕事で多く利用されるようになってきたことは言うまでもないでしょう。

そんな中、「ある言葉」が我々の耳に入るようになったり、
身近な存在になりつつあることにお気づきでしょうか??

その「ある言葉」とはズバリ…

         データマイニング

・・・おそらく、頭の中に「?」が浮かんだ方がほとんど
なのではないかと思います…笑
ですが、はっきり申し上げておきます。

この言葉を知らない人は将来恥をかきます。。。

この言葉が一般的な企業の仕事場で多く耳にする時代が
もうすぐそこまで来ています。

時代に取り残されていくのは嫌ですよね??

大丈夫!! まだ間に合います。
これから、未来の常識語となる「データマイニング」について、一緒に詳しく見ていきましょう!

1,難しいようで易しい?!           ズバリ、データマイニングとは?

では、さっそくデータマイニングについて調べてみましょう。

データマイニング(英語: Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。                 ※Wikipediaより引用

、、、正直分かりにくいですよね。私自身、この文章を初見で出されても理解できないと思います。

「未来の常識語となりうる言葉がこんなに難しいなんて、、、」

と、諦めかけている方もいらっしゃるかもしれませんが、、、大丈夫です!実はなんてことのない単純な言葉なのです。

ズバリ、データマイニングとは

たくさんのデータの中から自分の必要な情報(知識やルール)を探し発掘(マイニング)する技術のことです。

要は情報検索ですね。それがなぜ未来の常識語となり得るのか、、?実用例を出しながら、詳しく説明していきます!

2,ここを押さえよう!             データマイニングの3つのポイント

データマイニングは、大きく分けて3つの情報検索のことを指します。

1、マーケット・バスケット分析

情報同士の関係について分析すること

をマーケット・バスケット分析といいます。例を出すならば、コンビニが、「○○歳の男性は○○と○○を一緒に買う傾向にある」という情報を解析する時に使うのがマーケット・バスケット分析です。私たちが身近に感じるマーケット・バスケット分析は、某大手通信販売サイトで見る「あなたへのおすすめ」ですね!ビッグデータ時代に片足突っ込んだ今だからこそ、知らなくてはならない言葉です。

2、クラスター分析

たくさんの情報を分類することをクラスター分析といいます。このクラスター分析は、「階層クラスター分析」と「非階層クラスター分析」の2つに分けることができるのですが、「階層クラスター分析」はデータマイニングに適した探し方ではないので、この記事では「非階層クラスター分析」について紹介していきます!(階層クラスター分析について知りたい方は、他記事での検索をお願い致します。もちろん自己責任で!)

非階層クラスター分析とは、たくさんの情報を分類する時に

あらかじめ決めた数のジャンルごとに情報を分けていく方法

のことです。ややこしいですね。。ひとつ簡単な例を出します。

以下に何の脈絡もない9個の単語を羅列します。            りんご、ネズミ、パソコン、算数、トラ、テレビ、レモン、カメ、国語  これらを分類するために、あらかじめ4つのジャンルを用意します。   果物、動物、家電機器、教科                     そして、分類します。

果物  :りんご、レモン                      動物  :ネズミ、トラ、カメ                    家電機器:パソコン、テレビ                     教科  :算数、国語

これが非階層クラスター分析です。                                                                  この分類によるメリットは、どんなに沢山のデータがあってもジャンルの数をあらかじめ決めているので

大量のデータを簡潔にまとめることができるのです。

先にジャンルの数を決めてしまうとは、、、なかなか斬新な方法だとは思いますが、ビッグデータ時代に乗り遅れないようについていかなければなりませんね!

3,ロジスティック回帰分析

最後に紹介するのがこのロジスティック回帰分析です。名前が難しそうですが、、そこまで複雑ではありません。一言で言えば

データから発生確率を予測する手法です。

分かりやすく例を出しましょう。                   とあるコンビニがカップラーメンと洗剤の売上の関係性を詳しく調べたところ、次のようになりました。

顧客1:カップ麺 0個 洗剤 1個                 顧客2:カップ麺 1個 洗剤 1個                 顧客3:カップ麺 1個 洗剤 1個                 顧客4:カップ麺 0個 洗剤 1個

このデータから、顧客1と4、顧客2と3はタイプが似ていると言えるでしょう。さらに、洗剤と一緒に即席麺を買っている2と3は、食べ物を作る暇がない一人暮らし or 共働きの家庭である可能性が高く、1と4は食べ物を作る時間のある主婦(主夫)のいる家庭であると予想できるのです。

このような分析をロジスティック回帰分析と言って、これをすることによって、これから用意する商品の予定を組むことができるなどのメリットが生まれるのです。

いかがでしたでしょうか?                      もし、あなたがデータマイニングについて少しでも詳しくなれたなら、  もっとたくさんデータ分析について調べることをおすすめします!    この記事では書ききることができなかった未来の社会を切り拓く"鍵”がデータ分析には含まれています。お互い、時代に取り残されないように頑張っていきましょう!

最後まで記事を読んで頂きありがとうございました! by まさき

この記事が気に入ったらサポートをしてみませんか?