見出し画像

レッドパンダ・エフェクトと占星術 / データ・ノベルを読む

 『バタフライ・エフェクト』という映画が好きだ。どんな話かというと,過去に戻れる力(力?)を持っていることに気づいた主人公が,過去に戻って運命を変えようとする。そんなお話だ。この映画に与えられた題名は,物理学のアイディアである「バタフライ効果」に由来する。Wikipediaの「バタフライ効果」のページによると,バタフライ効果とはこんなものだ。

バタフライ効果(バタフライこうか、英: butterfly effect)とは、力学系の状態にわずかな変化を与えると、そのわずかな変化が無かった場合とは、その後の系の状態が大きく異なってしまうという現象。カオス理論で扱うカオス運動の予測困難性、初期値鋭敏性を意味する標語的、寓意的な表現である。

一般的には「蝶の羽ばたきが別の場所で台風を引き起こす」なんて寓話で知られている。つまり,小さな変化が大きな変化を引き起こす,ということ。『バタフライ・エフェクト』では,主人公が過去に戻り,運命を変えようとすることによって,現在に大きな変化が起こってしまう。まあ,詳しい内容はぜひ映画を観ていただきたい。

 「蝶の羽ばたきが別の場所で台風を引き起こす」という寓話は,蝶の羽ばたきという小さな空気の流れが,巡り巡って大きな空気の流れ,嵐を引き起こすかもしれない,ということを示唆している。そうは言ってもこれは寓話で,蝶の羽ばたきが本当に台風を引き起こしているわけではなく,あくまで「そういうイメージ」だ。蝶はそこらじゅうで羽ばたいており,そこらじゅうというのはちょっと言いすぎだけれど,とにかく蝶というのは世界に何万何億匹といるはずで,それらの一羽ばたきごとに一台風が生まれたらたまったもんじゃない。少なくとも僕は困る。そんなことは起こっておらず,「蝶の羽ばたき同士が打ち消し合うため実際に台風ができることはなく,間隔の広すぎる梯子は登れない」と末高は言った。言ってなかったかもしれない。でもなんかそんな感じのことである。

 スタッツ解析も,いわゆる「カオス物理学」に分類されるだろう。物理学とは「事物の真理を探究する学問」なので,スポーツアナリティクスも物理学の範疇であり,その気になれば世界の全てを物理学で包括することができる。
さて「カオス物理学」が何かというと,ここも Wikipedia に説明を譲ろう。

カオス理論(カオスりろん、英: chaos theory、独: Chaosforschung、仏: Théorie du chaos)は、力学系の一部に見られる、数的誤差により予測できないとされている複雑な様子を示す現象を扱う理論である。カオス力学ともいう。

 物理学は,ある情報を入力するとこれから起こる出来事の結果を予想してくれるもの,すなわち「方程式」を見つけ出すことが目標の1つである。例えば「速さ 10m/s の選手」という情報を入力して「100m 走のタイムは何秒ですか?」と結果を予想させ,「10秒です」と予想値が返ってくる。これが方程式。スポーツアナリティクスの究極の目標の一つは,少なくとも僕にとっての究極の目標の一つは,バスケットボールの方程式を見出すことだ。例えば,「大学時代のFT%は73%で,3P%は38%」と情報を入力して「この選手はキャリア最盛期にどんな成績を残す?」と結果を予想させ,「平均18得点前後で3P%は40%前後,FT%は85%前後」と予想値が返ってくる。返ってきて欲しい。返ってくるといいなー。しかしそのためには,結果に寄与する要因を適切に見極めなければならない。「水の温度を上げたい」として,よしそれならと握力を鍛えたって仕方がない。水の温度変化は「加熱 / 冷却」すなわち「熱の移動」に関係するのであって,握力とは関係ない。たぶん。関係なくない?水の温度変化に関わる要因「熱の移動」が明らかになったならば「加熱で1000 J の熱量を与えた。どれだけ温度が上昇する?」と結果が予想できるようになる。つまり,バスケットボール選手としての成功に関係する要因を発見することができれば,バスケットボールの方程式が完成する。しかし,ここで立ちはだかるのが「カオス理論」である。バスケットボールは人間がプレーする。そして人間の活動には,様々な要因が関連している。例えば握力,例えば脚力,例えば今朝の朝食,例えば友人との人間関係,例えば靴ひもを左右どちらから先に結ぶか。バタフライ・エフェクト。さらに,バスケットボールというスポーツ自体も,さまざまな要素で構成されている。チームメイトが変われば,戦術が変われば,対戦相手が変われば,アリーナが変われば,ハーフタイムショーがレッドパンダだったら,その選手のパフォーマンスは変化するだろう。バタフライ・エフェクト。それにハーフタイムショーがレッドパンダか否かで生じるパフォーマンスの変化量なんて,そもそも調べる気になれない。だれか調べてよとは思う。バスケットボールの「方程式」を見極めるには,重要なファクターの候補が多すぎて,どれがどれくらい,どのように寄与しているのか判断が難しい。レッドパンダ・エフェクトのおかげで,バスケットボール・アナリティクスが究極の方程式を導き出すことは永遠にないだろう。

 とも言い切れず,統計学の方もずいぶん発展している。スパースモデリングには感銘を受けた…とかいう話を語りだすときりがないのでさすがにやめておこう。スパースモデリングと,あと MCMC ね。ベイズ統計をちゃんと学習したいです。


 スポーツアナリティクスの他の醍醐味は,データの解釈である。ある選手の11月の成績と12月の成績を比較したとしよう。

11月:26.5得点(49.6%) 10.0リバウンド 4.0アシスト
12月:29.0得点(54.7%) 10.8リバウンド 4.8アシスト

あなたはこの変化についてどう考えるだろうか。「シーズンが進むにつれて徐々に調子が上がってきた」?そう考えた根拠はなんだろう。「FG%が5%以上上昇している」のは確かにそうだ。「FG%の上昇により,平均得点が上昇する。すると相手はその選手のスコアリングに気を取られるため,そのぶんアシストがよく決まるようになる」,なるほど,よくできたストーリーだ。そう,あなたがデータから読み取ったのは,あなたにとってのストーリーだ。本当にそうなのかは,データからは全く読み取れない。5%とは大きな差のように感じるが,シュートを20本撃って8本決めるか9本決めるかの差でしかない。5%の差異が,意味を持って生まれたのか,単なる統計誤差として生まれたのか区別できるだろうか。それに,月別のスタッツを比較すると,上がるか下がるか変わらないかのいずれかに収斂するに決まっている。二つの点をつなぐと,右肩上がりか右肩下がり,あるいは平行のどれかになるはずで,右肩上がりなら「調子が良い」し下がっていたなら「調子が落ちた」,平行なら「安定している」で筋が通り,すべての選手について共通の説明が可能となる。それでいいのか,少し戸惑う。現れたのが意味のある傾きなのか,たまたまその二点間がそう結ばれただけなのかは,一概には判別できないはずである。二点を結べば必ず直線が引ける以上,そこには何か示唆的な形がどうしても浮かび上がる。さてさらに,上のデータに10月のスタッツも加えよう。

10月:33.7得点(63.2%) 10.3リバウンド 5.3アシスト
11月:26.5得点(49.6%) 10.0リバウンド 4.0アシスト
12月:29.0得点(54.7%) 10.8リバウンド 4.8アシスト

「開幕時の好調が,12月になって戻ってきている」というアイディアは,間違いではないが正しくはなく,なぜなら間違っているのか正しいのかを判断するすべがないからで,3点を結ぶと必ず右肩上がり,平行,右肩下がり,上に凸な折れ線,下に凸な折れ線のいずれかになる。それが意味のある形なのかたまたまそうなったのかは,やはりこれだけの情報では分からないだろう。あなたがそう解釈した根拠はあなたの中にだけ存在し,彼は夜空を見上げて2つの星を結び「ちびたえんぴつ座」と名付け,別のより間隔の離れた2つの星を「あたらしいえんぴつ座」と呼んだ。任意の星を好きに結ぶと,任意の形が浮かび上がってくる。好きな点を好きにつなげば,なにかしら意味ありげな造形が姿を現す。そこに現れる形はあなたに依存し,あなた以外には依存せず,あなた次第で好きなものを見い出すができる。スタッツを解釈するとはそういう行為で,客観的な考察とはほど遠く,むしろストーリーを読み出す行為だ。「月がきれいですね」と言われたとして,それを「この人は月を見るのが好きなんだな」と受け取るのはあなたであり,「愛してくれているんだな」と理解するのもあなたであり,そこに相手の本心は現れておらず,夜空に好きな形を勝手に見い出している。もしかすると相手はスマートフォンを操作しながら適当に「月がきれいですね」と言ったのかもしれない。

 あなたはデータを通してあなた自身と対峙しており,なるほどそういうことだったのかと納得している。のかもしれない。星をただ眺めその運航から意味を編み出す行為は占星術と呼ばれ,科学とは呼ばれない。ただし占いは,的中することもある。


 科学的な取り組みというのは,主観から脱却し事象から普遍の法則を取り出すためにある。星をてんでに繋げるのではなく,星の光を一つ一つ丁寧に分析し,その星の情報,すなわち大きさや温度,構成元素まで解析すると,本当の意味でつながりのある星々が見つかる。「分光学」と言って,光を複数の光に分類し,細かく分析するのである。スポーツアナリティクスも同様で,120のFGAがあったとして,それを分FGAすると,そこにはプルアップジャンパー60本レイアップ40本フローターシュート20本という細かい分類が現れる。そうして分割して分割して,詳細に解析していけば,星一つ一つに対する正確な理解が得られるかもしれない。しかし残念ながら,すべての星について分FGAをすることはできず,単に作業量が多すぎる。なので他との比較が難しく,結局なかなか正しい理解にたどり着けない。それにできれば分REBもしたいし分ASTもしたいし,やはり作業量の壁が立ちはだかる。だがこれは単に作業量の多少の問題なのだから,プログラムを組んだりAI使ったりとかで攻略できるはずだ。そうすると,おいこの星はあそこの星と組成が同じだぞ,はてあの星が年をとるとこちらの星と同じ色味になるぞ,なんだあの星は爆死したと思ったら再生したぞ,というように,より真実に近い意味でのつながりが明らかになってくるだろう。ただしそこまでするとこれはもはや研究であり,私たちがそこまでしなければならない義理はなく,もっと気軽に夜空を眺めてあれってライオンの形に見えるよねあっちのはコモドドラゴンの形に見えるよねとやっている方が楽しい。少なくとも僕は,のんびりと夜空を眺める方が好きだ。ただし「のんびり」の程度は人による。


 私たちがデータから見出すのは私たちのアイディア自身である。しかしそこから,真実が現れることだってある。ティコ・ブラーエが占星術をするために何年も記録し続けた星の運行データから特有のパターンを見出した弟子のケプラーは,ケプラーの法則という真実にたどり着いた。同じものを見ても,中にはその優れた洞察で,真理を捉えることができる者がいる。私たちがデータから見出すのは私たちのアイディア自身だが,その中には,当然真理を捉えたアイディアもあるのだ。直観こそが最高の計算機であり,多くの科学的真理は根拠に先んじて結論が発想されている。

 だから私たちがすべきことは,データから読み解かれるアイディアの中には,誤っているものもあるが正しいものもあると,正しく認識することなんじゃないかな。「バイアスがかかることは仕方がない。大切なのは,私たちにはバイアスがかかっていると認識することだ」と言ったのは歴史上の偉人ではなく大学の教授なのだが,要はそういうことだ。小説と同じで,正しい読み方は存在せず,読み手一人一人が好きにデータを解釈すればそれでいい。データ・ノベルはあなたのためにあり,特定の読み方を他者から強制されるいわれはなく,あなたの読み方を他者に強制する必要もない。「私はこう思う」あるいは「こういう意味が込められているのかもしれない」というスタンスで,のんびりデータと付き合っていきたいな。と,僕はそう思う。

おわり。

注:本文中で使用したスタッツはヤニス・アンテトクンポ(MIL)のもの。NBA.com/Statsより。

この記事が気に入ったらサポートをしてみませんか?