見出し画像

【論文紹介】機械学習を利用してビールの味を予測・改善する

前提

人間の5感には、視覚、聴覚、味覚、嗅覚、触覚がある。視覚、聴覚については近年の生成AIで爆発的に研究論文やアプリケーションが生まれている。一方で、味覚、嗅覚についてはそこまで事例は多いという印象を個人的に感じていない。この理由としては、1)味覚や嗅覚は適切な言語化が容易ではないこと(評価が一意になりづらい)、2)評価の主観性が高い、のではないかと感じている。
そんななか、今年の2月にNature communicationsで機械学習と言語モデルを利用して、ビールの味を予測、改善することができるという論文が出版された。機械学習による食品の風味などの改善研究は多数行われているが、ざっと読む限りビールに限らない、あらゆる食品の改善に使えそうな印象を受けたので、きちんと中身を理解してみようと思った。

注意

私が個人的に気になって調べたメモです。この論文の著者ではないので、間違いが含まれている可能性があります。もしも間違いがあれば、XのDMで教えてくれると嬉しいです。

読んだ論文

この論文では、食べ物の風味は化学物質や外部要因の相互作用によって形成されるという立場で考えている。著者はベルギーの複数の研究機関から成るが、代表著者はVIB-KU Leuven Center for Microbiologyに所属している。

250種類のビールに対し、200以上の化学的特性と、訓練されたパネリストによる官能評価、18万件以上のオンラインレビューデータから得られたデータを組み合わせ、10種類の機械学習モデルを構築した。

化学的特性と官能評価の関係性

例えば、下図はこの論文で使われたビールの化学的特性(右上)と官能評価の記述子(左下)の相関関係の一部を表している。これをみると、例えば左下のパネルのBitterness(苦み)は、Hopsの項目と強い相関があることが定量的にわかる。


ビールの化学的特性と官能評価の記述子の相関関係

ちなみにsupplementary figuresにこれの全体を示したものがあって、全化学物質間の相関関係を表しており、これは壮観。

そして、もちろん化学的特性と官能評価の相関関係についても分析している。これを見ると、エタノールとグリセロールは、アルコールの強さ(Alcohol)や濃厚さ(Body)と正の相関を示していることがわかる。色の濃さ(Color)は、麦芽の風味(Malt perception)と正の相関を示している。これは、ローストした麦芽を使用することで、ビールの色が濃くなり、同時に麦芽の風味が強くなることを示唆している。

一方で、期待されるほどの関係性が見られない場合もあります。例えば、バラの香りがするフェネチル酢酸エステルは、花の香り(Esters - floral)との相関が弱いことが示されている。これは、ビールの風味が単一の化合物だけでなく、複数の化合物の複雑な相互作用によって決まることを示唆している。また、鉄(Iron)の含有量がホップの香りや苦味と負の相関を示すなど、少し直感と異なる関係性も明らかになっている。

この図は、ビールの化学組成と官能評価の間に存在する複雑な関係性を明らかにしていて素晴らしい。この情報は、ビールの風味を理解し、改善するための重要な手がかりとなる。ただし、単純な相関関係だけでは説明できない複雑な相互作用も存在するため、より高度な統計モデルや機械学習手法を用いた分析が必要であることが示唆される。

官能評価とレビューデータの関係性

次に、官能評価とレビューデータの関係性を示す。官能評価は、訓練されたパネリストによる評価(いわゆるビアテイスター)であり、レビューデータは一般消費者による評価。つまり、専門家と一般消費者による評価の違いを表している。横軸が「パネリストによる評価」、縦軸が「レビューデータによる評価」となっている。図中のpが相関係数で、これが高いほど両者の評価が一致していることになる。

例えば、苦味(Bitterness/Taste: bitter)や甘味(Sweetness/Taste: sweet)、アルコール感(Alcohol/Taste: alcohol)といった基本的な味覚については、訓練されたパネルとRateBeerのレビューの間に強い正の相関が見られる。一方で、より複雑な香りや風味、例えばエステル香(Esters aroma/Aroma: estery)やコリアンダーの香り(Coriander/Aroma: coriander)については、両者の相関が弱いことが示されている。

個人的な推測だが、専門家は細かい味の違いの評価を正確にできるが、一般消費者はタバコを吸ったり、他のものを食べたりと、管理されていない状況で評価を行うため複雑な香りや風味についてはあまり評価を正確に下せないのかもしれない。

化学的特性に基づく、官能評価や消費者嗜好の予測

ここまでで化学的特性と官能評価の関係性、官能評価と消費者嗜好の関係性が明らかになった。このデータを利用し、10種類のモデルを構築し、化学的特性から、官能評価(Trained panel)と消費者嗜好(Ratebeer)を予測した。
結論から言うと、Gradient Boostingが最も良い予測をすることができ、他手法よりも大きく優れていた。

Gradient Boostingでは、Feature importanceという重要度を計算することができる。これは、どの化学的特性がもっとも予測に貢献しているかを表している。これによると、

  • 酢酸エチルとエタノールが消費者の嗜好に最も大きな影響を与えている。

  • 乳酸や酢酸フェネチルエステルなど、一般的にはビールの品質に悪影響を与えると考えられている物質も、適度な濃度であれば嗜好を高める方向に作用する可能性がある。

  • 単純な相関関係では捉えきれない、化学物質と嗜好の複雑な関係性が存在する。

最後に上記で得られた知見を元に、重要な化学物質を実際にビールに添加することで、消費者の嗜好がどのように変化するかを検証している。

Control: 実験のベースとして使用されたもとのビール
Spiked: Controlビール + 化学物質を添加したビール

3つ実験をしており、
一番上:一般的なブロンドビールをベースとして使用した実験。機械学習モデルが選んだ最良の予測因子(化学物質)を、エタノールを含めてすべて添加した場合の効果を検証しています。

真ん中:ブロンドビールをベースとしていますが、エタノールを除く化学物質のみを添加した場合の効果を検証。これにより、エタノール以外の化学物質が嗜好に与える影響を独立して評価することができます。

一番下:ノンアルコールビール(アルコール度数0.0%)をベースとして使用した実験。ノンアルコールビールにエタノールを添加することは現実的ではないため、エタノール以外の化学物質のみを添加した場合の効果を検証しています。

右側の図
各評価項目についてスパイクされたビール(化学物質を添加したビール)を選んだ評価者の割合を示している。グラフ上部の数値は、二項検定によって計算されたp値であり、スパイクされたビールが有意に好まれたかどうかを示す。

結果を見ると、ブロンドビールとノンアルコールビールのいずれにおいても、化学物質を添加することで、エステルの風味、甘味、アルコール感、ボディ感、全体的な嗜好が有意に改善されたことがわかる。特に興味深いのは、ノンアルコールビールでもエタノールを除く化学物質の添加によって嗜好が向上したことです。これは、ビールの風味にはエタノール以外の化学物質も重要な役割を果たしていることを示唆している。

まとめ

この論文では、ビールの化学的特性と官能評価データを機械学習モデルで解析することで、ビールの風味と消費者の嗜好の関係を明らかにし、さらにはビールの改良にも成功した。特に、Gradient Boostingモデルが高い予測性能を示し、従来の統計的手法よりも優れていることが示されました。

私見では、この研究で用いられた手法は、ビール以外の食品や飲料にも応用できる可能性が高いと考える。多くの食品は、ビールと同様に複雑な化学組成を持ち、風味と嗜好の関係を理解することが困難です。機械学習モデルを用いることで、これらの関係性を解明し、食品の改良や新製品開発に役立てることができる。例えば、ワイン、コーヒー、チーズ、チョコレートなどは、いずれも複雑な風味プロファイルを持ち、消費者の嗜好も多様です。これらの食品に対して、本研究のアプローチを適用することで、風味と嗜好の関係性を解明し、品質改善や新たな商品開発に活かすことができると期待される。

また、本研究ではオンラインのビールレビューデータを活用することで、大規模な消費者の嗜好データを取得している。近年の言語モデルの進歩により、自然言語処理の精度は大幅に向上している。この技術を応用することで、オンラインレビューデータからより詳細かつ正確な嗜好情報を抽出できる可能性がある。例えば、最新の言語モデルを用いることで、レビュー中の微妙なニュアンスや感情表現を捉え、消費者の嗜好をより深く理解することができるかもしれません。さらに、言語モデルを活用することで、レビューデータから風味表現を自動的に抽出し、化学組成との関連性を分析することも可能になるでしょう。このようなアプローチは、官能評価パネルによる評価を補完または代替する手段として有望かもしれない。

ブログのサムネイルは
「プログラミング的に美味しい食品開発ができるようになり、プログラマーがパソコンで食品を作っている様子」
をイラスト化したものです。

この記事が気に入ったらサポートをしてみませんか?