信じたい情報を信じる時代（2月活動記録）

こーし

2024年3月5日 19:43

どうも。こんにちは。
ケミカルエンジニアのこーしです。

今週はブログを書けませんでしたが、データサイエンスの勉強記録と所感、気になるニュースについて少しだけ書いてみます！

ちなみに、別アカウント（note）で6記事ほど書いてみたところ、1ヶ月で300ビュー、23いいねをいただきました。

noteは初心者にやさしいアルゴリズムのようですので、これから情報発信を始める方は、noteで気軽に書いてみることをオススメします！（無料です）

1．所感

（1）信じたい情報を信じる時代へ

いきなりですが、みなさんの知っている情報は”真実”でしょうか。
自分の常識を疑うことはありませんか？

薄々感じてはいましたが、テレビで流れているニュースや学校で習った歴史は、どうも真実ばかりとはいかないようです。
テレビ局や政府（教育機関）など、権威ある組織なら間違ったことは言わないだろうと、疑うことなく生きてきたのではないでしょうか。

しかし、情報には必ず「伝え手の意図」が含まれます。

どんな情報を伝えたいのか。読者にどう感じて欲しいのか。など、どうしても伝え手のフィルタがかかってしまいます。

さらに、最近ではＡＩによるフェイクニュースやフェイク動画が話題になっています。偽の情報を、あたかも真実のように見せることができるようになってしまいました。

どんな情報にも誰かの意図や利益が絡んでくることを理解しなくてはいけません。
そこで、これからは「情報を疑う姿勢」と共に、「どんな情報を信じたいか」が大事になってくると思います。

例えば、「職場のＡさんが、自分の悪口を言っていたらしい」という情報を耳にしたとします。

この情報を聞いて、嫌な気分になるのか、それともＡさんはそんなことを言うはずがないので、何かの勘違いだろうと考えるのか。

同じ情報でも、受け取り方次第で大きく変わります。

また、「添加物を食べると病気になりやすい」とか、「何年何月に大地震がが起こる」など、暗い情報を気にして生きるよりも、「これをやれば健康になる」や「不幸は幸せになるための試練である」など、前向きで明るい情報を信じて生きた方が幸せなのでないかと考えています。

（2）活動記録

早いもので、２０２４年は２ヶ月（１／６）も過ぎてしまいました。。。
ここで、年初に掲げた目標の進捗確認をしてみます。

✅2024年の目標（仮）
今年の目標はこれでいこう！
方針：化学・化学工学×データサイエンスで社会貢献
テーマ：統計学、キャリア（専門性）、DX、LLM、化学業界、ソフトセンサー、異常検知、制御
【積み上げ目標】
①ブログ100記事到達（+29記事）
②note　+20記事
③X　+300ポスト
④読書　30冊
— こーし⚡️ケミカルエンジニア (@mimikousi) January 1, 2024

すでに２ヶ月経っているので、進捗率は2/12 = 1/6 = 16.7%が理想です。
では見ていきましょう。

①ブログ100記事到達 +29記事　2/29 = 6.9% ×
②note ＋20記事　この記事含め 3/20 = 15.0% △
③X +300ポスト　23/300 = 8.0% ×
④読書　30冊　8/30 = 26.7% ○

ヤバい結果でした。。
いつもインプット多めで、発信が少なくなってしまいますね。
（別アカウントのnoteを含めれば、noteの進捗は良いかも）

3月も「やりたいこと」に集中しつつ、より多くの人に興味を持ってもらえるような内容でブログやnote、Ｘでの投稿を増やしていきたいと思います！

2．気になるニュース

（1）新素材カポック（元旭化成）

「カポック」とは、薄くて暖かい、木の実由来の素材です。動物性原料でもなく、化学繊維でもないので、環境配慮型高機能素材として注目されています。

衣・食・住に関わる製品は、無くなることがないので魅力的ですが、流行や新素材の登場に気をつける必要があります。

また、化学繊維はかつて日本のお家芸でしたが、今では完全に中国に奪い取られてしまいました。しかし、一部の高機能化学繊維（ベンベルグなど）はまだ生き残っています。
高機能化学繊維に加えて「カポック」のような天然素材もレパートリーに入れることで、衣料分野のビジネス基盤をさらに安定化できれば良いですね。

よって、このような起業家や社内企業家を育て、応援（資金提供）していくべきだなと考えています。

住については、建材ビジネスが好調であり、旭化成や積水化学でも大きな収益源となっています。

しかし、「日本の住宅寿命が短すぎる」という問題があります。
日本の住宅寿命は30年強ですが、イギリスでは80年強です。
２倍以上も違うということは、２倍以上住宅にお金を使うといっても過言ではありません。
神社やお城は200年以上もつと言われているにも関わらず、一般の住宅が30年強しか持たないのは、何か違和感がありますね。

住宅の長寿命化は、建材ビジネスにとってはマイナス要因ですが、「あるべき姿」を考えると、住宅・建材の長寿命化は一気にブレイクスルーを起こす可能性を秘めていると思います。

（2）研究とはこういうことだ

研究とはこういうことなんだろうなと思ったので、紹介してみます。

当時小学４年生だった小森日菜子さんは、国立科学博物館で「ヤマイヌの一種」として保管されていたはく製を見て、これはニホンオオカミではないかと思ったそうです（情報を鵜呑みにしない姿勢が素晴らしい！！）。

また、このはく製は「ヤマイヌの一種」として扱われ、よく調べられていなかったことを知り、専門家に相談しながら博物館などで公開している過去の記録を調べ、考えをまとめて自由研究（レポート）で発表しました。

このレポートは文部科学大臣賞を受賞したほか、「この調査結果をぜひ学術論文として世に残して欲しい」と提案を受け、2年間の追加調査の後、国立科学博物館が発行している電子ジャーナルで論文を発表しました（中学１年生の時）。

調べていくなかで新たな謎が出てきて、そこをさらに調べて解くことが大変でしたが楽しかったです。ニホンオオカミはたくさん研究されていますが、真の姿は分っていないので、色々な謎が残されています。真の姿を知りたい、解明したいというのがやっぱり一番です。

小森日菜子さんの発言より

小森日菜子さんの発言からわかるように、探究心というか、趣味というか、楽しさというか、やはり、「好きなことを追求する」ことが、「研究」なんだなと思いました。

世の中に出ている（しかも国立科学博物館のような権威ある組織の）情報を鵜呑みにせず、疑問に思ったことをとことん調べて真実に近づいていく。

この記事を読み、小学生でもできているのに、オッサンも負けてられないなと思いました。

3．データサイエンス勉強記録

（1）スモールデータ解析と機械学習

こちらの書籍で、変数選択を勉強しました。

ステップワイズ法
LASSO
PLS-beta
PLS-VIP
NCSC-VS

これらに加え、金子先生の「実践データサイエンス」で紹介されていたborutaも追加し、実務で比較しながら使ってみました。

なかでもborutaとNCSC-VSは、予測精度が良くなる傾向でした。

borutaはコードが簡単でエラーも少ないですが、計算に時間がかかるというデメリットがあります。一方、NCSC-VSはコーディングが大変（エラーも多い、、）でしたが、計算が速く一番精度が出やすい印象です。

今後も、色々と試行錯誤して変数選択を使いこなしていきたいです。

（2）回帰分析

変数選択をきっちりやっても、精度がなかなか良くならないことがあります。「なぜ精度が上がらないのか」を考える上で、作成した予測モデルが「なぜそのような挙動をするのか」を考えることが大事です。

「スモールデータ解析と機械学習」の7章「データ収集や解析の心構え」はとても有用。
製造業でデータ解析に携わる人全員に読んで欲しい。
「機械学習モデルにおける不具合は、なぜうまくいかないのか、を考えるよりも、モデルがなぜそのような挙動をするのかについて、考察した方が有益なことが多い」
— こーし⚡️ケミカルエンジニア (@mimikousi) February 25, 2024

作成した予測モデルの挙動を調べるために、「残差分析」が使えるのではないかと考え勉強してみました。

残差分析（回帰診断法）については、「統計検定準1級対応　統計学実践ワークブック」と「回帰分析」で勉強しました。

pythonで実装し、残差分析できるようになったので、おいおい実務でも使ってみたいと思います。

また、残差分析については、残差プロットの描き方や解釈の仕方について、ブログで解説できたら良いなと考えています。

本日は「回帰分析」の「6.4残差の分析」を勉強！
本書で紹介されているアンスコムの数値例を使って、残差分析をしてみた。
回帰式と決定係数R2が全く同じでも、残差分析すると結果が大きく異なる。
例えば、Y1は理想的なケースだが、Y2は非線形性が疑われる。。 pic.twitter.com/52dRDibCs6
— こーし⚡️ケミカルエンジニア (@mimikousi) March 3, 2024

残差（＝予測値ー実測値）の等分散性や正規性の確認、さらに説明変数ｘと目的変数ｙの間の非線形性を確認することで、予測モデルの改良のヒントになると考えています。

ではまた、今週も楽しくお勉強しましょう！

この記事が気に入ったらサポートをしてみませんか？