AI時代にものをいうのは、結局、データなのだな、という話
東大の人工知能講座は、とうとう最終盤にさしかかっている。
先週の宿題は、「日英翻訳プログラム」をつくるというものだった。翻訳ソフトが「今週の宿題」みたいなノリでつくれるものなのか、と思うかもしれないが、つくれてしまうのだ。
それで、今週の宿題は「画像をみて説明文を生成するAIをつくる」だ。
たとえばこんな画像を見せると、
a person on the beach flying a kite
といった文章を出力する(このプログラムを、来週の月曜日までに書かなくてはいけない……)。
それで、なぜこんなことができてしまうのかといえば、AIプログラミングでは、人間ではなく、コンピュータが自分でアルゴリズムを考えるからだ。人間が用意するのは、大量のデータと、それを学習するためのプログラムだけだ。
となると、結局、ものをいうのは、データなのだ。ということで、最近はデータの集め方や活用の本ばかり読んでいた。
Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド
Pythonの基本やHTMLなどのしくみから、データの収集方法までをきちんと解説している本。例が多い。
Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう
集めたデータをどうやって機械学習にかけるかというところまで書いてあるのがとてもいい。おもしろい本。
退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング
変わり種も1冊。題名の通り、プログラマじゃないひとでも読めるように本当にいちから書いてある。そのかわり、616ページとかなり分厚い。リファレンス的に置いておく手もあると思う。
課題の提出が終わったら、ためしにTwitterボットでもつくってみようかな。
そうだ。たまに聞かれるから書いておきますが、仕事も、ちゃんとやってます。ていうか、めっちゃやってるから!
読んでくださってありがとうございます。サポートいただいたお金は、noteの他のクリエイターのサポートに使わせていただきますね。