見出し画像

すぐに仕事で活かせるAI講座 第三部 その3

その予測、どの程度信頼できるの?
そもそもこの予測は、どの程度正しいの?そう思うのは当然です。


現実の業務としては、今回のようにきれいなデータではなく、"ノイズ" つまりこの直線に上下した値が ばらばら="分散" して存在していると説明しました。


このどの程度正しいの?という問いへの答えは、ほとんどの点を囲むように、周りに同じ幅の枠を描画してみましょう。 この同じ幅の枠のことを、データ サイエンティストは、"信頼区間" といっています。(今回は、あえてEXCELで描いてみました。実際はAIが描いてくれるから大丈夫です)


この枠、"信頼区間"によって 「輸出量はこの枠内に収まる」ということを、自信を持って、つまりこの程度、信頼できる! と言うことができます。

その理由は、下記の通り過去のほとんどの輸出量が同じ幅の枠に収まっているからです(笑)。

【上の図 信頼区間※3を追描】※3 実データの外枠帯状のもの、上の図では青い枠組 を信頼区間という、という程度の理解でまずは大丈夫です

これで信頼区間について基本的には説明することができます。

上記データの場合では、352データ中350データを同じ幅の枠内に収めているので、99%の信頼区間ということになります。なお天気予報の信頼区間は82%程度です。


8割程度の信頼区間でOK

実業務でも8割程度の信頼区間、わかりやすく言うと未来予測に

上下2割程度の余裕(幅)を取っておくと安心です

&実用に対応できると考えています。逆に、未来予測の精度がいくら高くても、2割程度は余裕を見たくなるのでないでしょうか?
(今の天気予報を使っていて、日常生活には支障ないですよね)

よろしければサポートよろしくお願いします。いただいたサポートは、日中韓とアメリカのリアルタイム感情分析を進めるために使わせていただきます