見出し画像

すぐに仕事で活かせるAI講座 第一部 その1

AI(えーあい)をこれから始める人に

まずは用語の解説から
本当は、高度な数学(ベイズ統計等々)やコンピュータ-の専門用語を詳細に知っていないと理解は非常に難しいのですが、それらを一切使用せずにその基礎を紹介します。

まず初めに、基礎用語から

AI(えーあい と読みます):

人間の知能を機械で再現しようとする試み。
ペッパー君のように人と普通におしゃべりしたり、画像を見て判断したりする際の後ろで動くのは「汎用AI」と呼ばれます(実現を目指して開発が進んでいます)。
現状は、特定の作業(画像分類や音声認識など)に特化したAIまでしか実現できておらずこちらは「特化型AI」と呼ばれています。

      【図1 特化型AIサービス提供企業】

・何が違うのか?
これまでの「データ活用」は「過去」についての分析であり、AIを取り入れたこれからのデータ活用は、
それに追加して、将来なにが起こるかまで予測することが大きく違います。
なお、「優れた未来予測モデルを作る」点よりも、むしろ「正確かつ分かりやすく、管理しやすい未来予測モデルを製品化する」ほうが難しいです。

具体的に言うと、未来予想として一般的な、天気予報の適中率精度をさらに向上させることは可能(現在82%程度)ですが、この天気予報をビジネスにするのは難しい、ということです。
つまり、天気予報単体でビジネスになることはなく、天気予報×コンビニ、天気予報×航空産業のように提携が必須となります。

機械学習:
コンピュータ-に大量のデータを入力して、そのデータを解析し、有用な手法/法則性を抽出する手法です。具体的には、ヒトが経験やデータを学習して法則性(いわゆる勘)などを生み出すように、ヒトがコンピュータ-に答えを出すための手法/法則性(プログラム)を書いて与えるのではなく、
コンピュータ-が自分で膨大なデータを学習して、手法/法則性を作るもの、と定義されています。
(作る手法例:過去データから未来を予測する、AorBを分類する、異常値を検出する等々)

機械学習の仕方:

教師あり/教師なしの大きく二つがあります。
文字通り、答えを教えるのか教えないのかの違いです。参考までに、2015年にプロの囲碁棋士を倒したAlphaGoは教師あり学習、そのAlphaGoに圧勝したAlphaGoZeroは教師なし学習で学習したプロダクトでした。AlphaGoZeroは教師無し学習の中の強化学習という手法を用いています。強化学習とは具体的にいうと、は碁の基本的なルールだけ教えて打ち手は教えず、あとはAlphaGoZeroどおしで対局をさせて強い手を学習したそうです。どういった手が強いのかは全く教えていないので教師無し学習というわけです。


よく使われる機械学習のプログラミング用の言語
この機械学習でよく使われるプログラミング言語として「Python」と「R」があります。

これらのプログラミング言語は
 1. 機械学習やディープラーニングの「ライブラリ※1」が豊富にある
※1:汎用的に使えるようプログラムをまとめたもの
 2. 科学計算や統計解析が得意
 3. オープンソースで開発されているフリーのプログラミング言語
   などの理由でよく使われています。

・Python(ぱいそん と読みます)
 「学習コストの低さ」「豊富なライブラリ」が特徴のプログラミング言語とされています。機械学習分野に限らずWebアプリやデスクトップアプリなどの開発にも使われています。

・R(あーる と読みます)
 統計解析に特化したプログラミング言語とされています。データ解析機能/グラフ描画が得意。(個人的にはこのRが得意ですが、この説明では一切使わないですよ)

ディープラーニング:
機械学習の中の手法の一つ と理解しておけば、とりあえず問題ありません。一応定義をそのまま言うと人間の脳の神経(ニューロン)の働きかたを模して造られたニューラルネットワークを多層に重ねたもの。
正確には、ディープラーニング=機械学習 でありませんし、また機械学習=強化学習でもありません。 くわしくは追々説明しますが、AIを実現する技術の一つとして「機械学習」があり、機械学習の中の技術の一つとして「ディープラーニング」がある、という程度で問題ありません。

よく使われるディープラーニングライブラリ
有名なディープラーニングのライブラリ※1をいくつか紹介。
  ※1:汎用的に使えるようプログラムをまとめたもの

・scikit-learn
  Python向け機械学習ライブラリの定番。分類・回帰・クラスタリング・次元削減など、機械学習でよく使われるアルゴリズムをサポートしている。

・TensorFlow
 Googleがオープンソースで公開したディープラーニング向けライブラリ。
汎用性・拡張性が高い。ドキュメント、チュートリアルが豊富。

・Chainer
 日本の企業「Preferred Networks」が開発したディープラーニング向けライブラリ。柔軟な学習ネットワークの構築が可能。日本語のドキュメントが充実。

・Caffe
 高速な計算処理が得意なディープラーニング向けライブラリ。

よろしければサポートよろしくお願いします。いただいたサポートは、日中韓とアメリカのリアルタイム感情分析を進めるために使わせていただきます