世界はAIだけになる、その時、人間は？

2023年12月21日 19:03

世界はAIだけになる

　ある人が、３０年、４０年すると、物理とか化学はなくなると言っていた。どの分野もAIにどう聞くかが重要になり、覚えることは必要なくなってくるという意味だ。
それを聞いて、そうだなと思って、AIを勉強してみた。

今日の一歩

　AIの分野にはKaggleというAIで予測したことの確からしさを競うコミュニティーがある。全文英語。ここのチュートリアル（正確には日本語でCODEXAというところにあるもの）を今日は２題やってみた。
　１つはメルカリの２０１７年の課題で、メルカリ出品物の価格を予想するもの。もう１つは、タイタニック号乗船者の属性から、生存か死亡かを予想する課題だ。
　メルカリの方は、ランダムフォレスト分類器という手法を、タイタニックの方は、決定木という手法を使っての予測だ。決定木をたくさん使って森のようにするのがランダムフォレストという手法だ。
　AIに予想させるにはPythonというプログラム言語でコードを書く。ただし、チュートリアルに正解は書いてある。正解は書いてあるが、コードの意味が分からないところが多い。わからないところを自分で調べるのが、少し前までの、いわゆる勉強だった。そしていかに効率よく勉強するかが競争の対象だった。

ChatGPTが教えてくれる

　今や、そのわからないコードをChatGPTに聞くと丁寧に解説してくれる。７，８年前に、AIを独学した時とは比べ物にならないくらい人間の理解が早まる。
　たとえばfitというメソッドが出てくるのだが、これが良くわからなかった。ChatGPTに聞いたら、丁寧に教えてくれた。これだけ調べようと思ったら、どれだけ時間がかったことか。

　丁寧に教えてくれたテキストは、原稿全体より長くなるので、最後に付録としてコピーしておく。

　こんな説明をしてもらえるなら、学ぶということ、知るということが変わってくる。あまりにすごい。

　チュートリアルの通りのコードでもうまく動かないこともある。そういう時もエラーの内容を、ChatGPTにコピペすると、ここをこう書けと教えてくれる。賢すぎる。

コードもChatGPTが書いてくれる

　AIを訓練するためのCSVファイルと、予想させる項目のCSVファイルをそのまま、ChatGPTにアップロードするだけでも、コードを書いてくれる。最初はこの条件が足りない。これではできないと言ってくるが、こちらがこうしろああしろというと、動くコードを仕上げてくれる。それも、コード以外の但し書きもふんだんにつけて、わかりやすく作ってくれる。私だけでは予想のコードをゼロから書くことはできない。間違いなく、私よりレベルが高い。高いどころか有段者と、素人並みに違う。恐ろしい。

３０年後はどうなっているかわからないのが人間

　今、世界に何億人か、AIに関係している人がいるだろう。昨日まで、私は最下位グループの一番下の層にいた。今日も最下位グループのほぼ底にいることは変わりない。しかし、このまま、毎日やっていけば、１日に１万人くらい追い越していけるのではないか。３０年続けたら、トップ１万人か１０万人に入っているのではないか。やらないと、新たに参加してくる人たちに追い越され順位は毎日１万位くらい落ちていくだろう。

　実際は、今日１日やってみて、道の険しさに、くじけそうだ。明日はいかに。

付：fitメソッドの説明

my_tree_one = my_tree_one.fit(features_one, target) は、機械学習の決定木モデル（ここでは my_tree_one という名前で示されている）を訓練するためのものです。この行の目的と動作を詳細に説明します。

コードの説明

my_tree_one: これは、DecisionTreeClassifier や DecisionTreeRegressor など、決定木ベースのモデルのインスタンスです。正確なモデルの種類（分類または回帰）はコードからは明らかではありませんが、決定木モデルを示しています。
fit(features_one, target): fit メソッドは、モデルを訓練データに「適合」させるために使用されます。features_one は、モデルの訓練に使用される特徴量（入力変数）を含むデータセットを指し、target はモデルが予測しようとするターゲット変数（出力変数）を指します。

モデルの訓練

このコードを実行すると、my_tree_one モデルは features_one データセットのパターンを学習し、これらの特徴量を使って target 変数を予測できるようになります。決定木モデルは、データを分割する一連の「質問」や「ルール」を学習します。これにより、新しいデータが与えられた際に、学習したパターンに基づいて予測を行うことができます。

使用後のモデル

fit メソッドはモデル自体を変更し、訓練済みの状態にします。そのため、このメソッドの実行後、my_tree_one は訓練データに基づいて学習された状態になります。訓練後のモデルは、新しいデータに対する予測やモデルの性能評価に使用することができます。

注意点

決定木モデルは、過学習しやすい性質を持っています。過学習を防ぐために、モデルのパラメータを適切に設定し、検証セットを使ってモデルの一般化能力を評価することが重要です。
決定木モデルの性能は、特徴量の選択と前処理に大きく影響されます。データの探索と前処理を適切に行うことが重要です。

読んでいただけると嬉しいです。日本が元気になる記事を書いていきます。