見出し画像

【新刊紹介】『機械学習教本』(柴原一友、築地毅、古宮嘉那子、宮武孝尚、小谷善行 共著)

好評発売中の新刊『機械学習教本』(柴原一友、築地毅、古宮嘉那子、宮武孝尚、小谷善行 共著)の紹介です。

ヘッダ

『機械学習教本』の内容が、実際のデータ解析実務にどのようにつながっているのか、本書の著者であり、テンソル・コンサルティング社でデータ解析を活用したコンサルティングをされている、築地毅先生に解説いただきました。

***

『機械学習教本』とテンソル・コンサルティング

著:築地毅

【目次】
・はじめに
・機械学習やAIへの機運の高まり
・機械学習と「正しく」付き合えていますか?
・『機械学習教本』って?
・テンソル・コンサルティングって?
・『機械学習教本』で読み解く、テンソル・コンサルティングのお仕事
・本記事を読んでくださった皆さんへ

① はじめに

このたび、本書『機械学習教本』が出版される運びとなりました。

『機械学習教本』は、東京農工大学名誉教授の小谷善行先生、茨城大学講師の古宮嘉那子先生、テンソル・コンサルティング株式会社数理戦略コンサルタントの柴原一友、宮武孝尚、築地毅の5名で執筆しました。構想・執筆6年、とてもとても長い時間がかかってしまいました……。無事に世に出すことができて、著者一同まずは一安心しています。編集者の太田さんには多大なご心配をおかけしたことと思います、本当にありがとうございました。

あとで自己紹介させていただきますが、テンソル・コンサルティング(以下テンソル)は、具体的に機械学習をビジネスに活用しています。今回はその経験を活かして『機械学習教本』を執筆させていただきました。ここでは『機械学習教本』が、テンソルのお仕事とどのように関わっているか、学生の方や、若手エンジニアの方向けにお話ししたいと思います。私たちのお仕事を先生的な立場でお話しするのは、ちょっとした気恥ずかしさもあるのですが、せっかく森北出版さんからいただいた機会ですので、私たちの仕事ぶりを通じて機械学習を活用したお仕事に興味を持ってもらえたら嬉しいです。

② 機械学習やAIへの機運の高まり

ご承知のとおり、近年機械学習やAIが世間から注目されています。皆さんの周りにある、AIが使われているものを思い浮かべてみましょう。質問に対して回答してくれるAIスピーカー、気温に合わせて温度を調整してくれるエアコン、コンピュータ将棋などのゲームプレイヤー……。最近は自動運転技術の進化も注目を浴びていますね。

また、AIや機械学習を“使う”だけではなく、“作る”ためのプラットフォームも充実してきました。R、Python、Chainer、TensorFlowというキーワードを聞いたことのある方も多いのではないでしょうか。ちょっとしたプログラミング技術さえ身につければ、誰でも機械学習でワクワクするような世界を作ることができる、そんな世の中になってきました。

③ 機械学習と「正しく」付き合えていますか?

そのような機運が高まる中だからこそ、私たちは皆さんに問いかけたいことがあります。「簡単に使えるようになったけれど、正しく機械学習と付き合うことができていますか」と。次のような質問を受けたら、自信をもって答えることができますか?

・何を予測したいのか、整理はできていますか?
・データの準備方法、注意点は網羅できていますか?
・皆さんの選んだその学習手法、メリットとデメリットはわかりますか?

多くの方が、多種多様な機械学習の手法について、仕組みや違いをつかめずに悩んだことがあるのではないでしょうか。それは、多種多様な機械学習の手法に踏み込んで本質を説明している書籍がなかなか無いことも理由の一つかと思います。

④ 『機械学習教本』って?

『機械学習教本』は、「機械学習のしくみを理解して、学習手法を適切に選んで使いこなせるようになりたい」「でも、忙しくて数式だらけの本を読む余裕がない」という方向けに執筆しました。機械学習を使いこなすのに必要な考え方やしくみを、数式にはあまり踏み込まず、言葉とイメージで丁寧に解き明かしています。

まずは、第1章と第2章で機械学習の全体を俯瞰しています。データ解析の一連のプロセスや、手法の特徴や性質の違いなど、エンジニアに必要な広い視野で機械学習をとらえました。そして、第3章以降では、個々の学習手法の考え方とその仕組みを解説しています。

⑤ テンソル・コンサルティングって?

テンソルは、世界に通用するAI技術や機械学習技術を使って、社会の発展に貢献することを目指しています。画像解析、言語解析、音声認識といった分析技術や予測技術を主軸とし、さまざまな業種のお客様に最先端の技術を提供し、ビジネスの拡大のお手伝いをしています。ノンバンク系企業様を中心に、銀行、保険、IT、重工業、研究機関など、さまざまな業界のお客様とお付き合いをさせていただいています。

⑥ 『機械学習教本』で読み解く、テンソル・コンサルティングのお仕事

この記事を読んでいる皆さんの中には、すでに機械学習に触れたことのある方も多くいらっしゃることでしょう。近年はプラットフォームも充実しているため、簡単に試すことができたと思います。もしかすると、テンソルのお仕事もその延長線上にあるものと思われるかもしれませんね。しかし、業務に関わる実データを使った分析作業は一筋縄ではいかないのです。

ここではテンソルのお仕事を少しだけ紹介してみます。

・ヒヤリング
お客様が何を望んでいるのかについて、徹底的な打ち合わせを行います。
もちろん、お客様は業務のプロではありますが、機械学習のプロとは限りません。そのため、「予測したい」「実現したい」と思っていることが、そのまま機械学習で解決すべきことではない、というケースは多々あります。
そこで私たちは、お客様のビジネスモデルを丁寧に解きほぐし、本当に機械学習で予測するべき問題は何なのか議論を重ね、本当にお客様が求めている要件を明らかにします。その際、業務のプロであるお客様の業務知識はとても大切です。お客様の業務知識を頼りにして、解決の糸口を探っていくのです。
たとえば、お客様の業務の流れを知らずに、業務を改善することなんてできるわけないですよね。このように機械学習の知識だけでは、お客様が求めているものを実現することはできないのです。

・データの準備
ヒヤリングで明らかにした要件を、実現するためのデータを準備します。
一番大切なことは、要件に合わせた「正解情報」を用意することです。クレジットカードの貸倒れを予測したいなら、ある顧客が貸倒れたか否かという情報、画像に写っているものを当てたいなら、何が写っているのかという情報が「正解情報」に当たります。このような正解情報を使って学習する手法を、一般に「教師あり学習」とよびます。
残念なことに、お客様が要件に合った「正解情報」を持っていないため、要件を実現できないというケースもあります。その場合はまたヒヤリングを行い、お持ちのデータに合わせて要件を定義しなおす必要があります。
ところで、貸倒れを予測する際には、いつ貸倒れたのか、いつ入会したのか、という「いつ」の情報が実はとても重要です。詳しくは『機械学習教本』を読んでいただきたいと思いますが、「リーク」とよばれる、「正しく機械学習ができたように見えて、全然うまくいっていない状況」に陥ることすらあるので、データの準備作業には細心の注意を払う必要があります。

・モデルの構築
準備したデータと機械学習手法を使って、モデル(貸倒れや画像に写っているものを当てるための仕組み)を作ります。
『機械学習教本』で詳しく説明しますが、モデル構築にはたくさんの手法があり、課題ごとに適切な手法を選ばないといけません。たとえば、クレジットカードのリスク判定であれば回帰分析、画像分析であればディープラーニングなどがよく使われます。モデルの構築についても、何度も何度もお客様と議論を重ね、お客様がご納得いただける品質のモデルが構築できるまで、さまざまな試行錯誤を重ねることになります。

以上が一般的なテンソルのお仕事の流れの一部です。

ところで私たちは、「どのようなモデルを構築すべきか」、「どのようなデータを準備すべきか」はもちろんのこと、さらに「お客様の業務について改善ポイントはどこか」、「どのくらいの効果があげられそうか」ということも、お仕事の開始時点から考えています。

お仕事で機械学習を扱う際、単に精度の高いモデルを作ればよいというわけではありません。改善する価値のあるツボを見極め、いかに「効く」ソリューションを提供できるかが勝負の分かれ目となるのです。

機械学習を使ったお仕事において、最も大事なことは「先を見据えて」、「決められた期間内」に「お客様に満足いただける」良い仕事をすることです。そしてそのためには、機械学習の深い知識と合わせてさまざまな分析業務で培った経験が必要となるのです。

なお、テンソルのより詳しい仕事内容は、テンソルのウェブページで公開しています。「プロジェクト事例」からご覧いただけます。

http://www.tensor.co.jp/casestudies.html

⑦ 本記事を読んでくださった皆さんへ

本記事を読んでいただき、機械学習と機械学習を活用したお仕事について少しでも興味を持っていただけると幸いです。もしよろしければ『機械学習教本』で機械学習の本質を学んでみてください。冒頭でもお話ししたとおり、最近私たちの身の回りには、AIが使われている面白いものであふれています。そしてAIには、機械学習の技術が随所に活用されています。機械学習と正しく付き合えるようになれば、このようなワクワクする世界を創造する一員になれるかもしれません。皆さんも機械学習の本質を学んで、私たちと一緒にこの魅力的な世界へ足を踏み入れてみませんか?

***

『機械学習教本』

ヘッダ

「機械学習のしくみを理解して,学習手法を適切に選んで使いこなせるようになりたい」
「でも,忙しくて数式だらけの本を読む余裕がない」
…という方へ!

本書では,機械学習を使いこなすのに必要な考え方やしくみを,数式にはあまり踏み込まず,言葉とイメージでていねいに解き明かしています.

まずは,第1章と第2章で機械学習の全体を俯瞰します.
データ解析の一連のプロセスや,手法の特徴や性質の違いなど,エンジニアに必要な広い視野で機械学習をとらえます.

第3章以降では,回帰分析/ディープラーニング/ベイズ理論/決定木学習など,個々の学習手法の考え方とモデルのしくみを以下の構成で解説します.

【発想】
そこで紹介する学習手法がどのようなアイデアに基づいているのかを概観します.

【モデル】
アイデアがどのようにモデルに落とし込まれているのか,その理論について詳しく解説します.

【実装】
Rによる簡単な実装例で,その技術が自分の道具として扱えることを体感してもらいます.

【発展的な話題】
いくつかの章では,高度で専門的な話題も紹介しています:CNN,深層生成(第5章 ディープラーニング)/アンサンブル学習(第8章 決定木学習)/LDA(第10章 クラスター分析)など

【本書目次】
1 機械学習序論
2 データマイニングの基本
3 回帰分析
4 ニューラルネットワーク
5 ディープラーニング
6 サポートベクターマシン
7 ベイズ理論
8 決定木学習
9 勾配ブースティング
10 クラスター分析
11 主成分分析

この記事が気に入ったらサポートをしてみませんか?