PythonでWordCloudによる分析

Pythonで口コミなどのテキスト分析で使用するWordCloudを実行できたので簡単に手順化しました。正直コードは簡単ですが環境構築で手間取り、その解決策を簡単な手順の中に織り込みました。詳細は他サイトを参照ください。開発環境はWIndowsによるVS Codeのみです。環境構築で迷った際は以前の投稿のhttps://note.com/consulbyanalysis/n/nd9a62914f48e参考ください。

  1. WordCloudインストール

  2. MeCabのインストール

    1. 私の環境下のPython3.12.0では下記を追加

      1. Microsoft Build ToolsでC++などのインストール

      2. MeCab Window 64bit バイナリをインストール

  3. コードを記載(下記は中身の手順)

    1. テキスト読み込み

    2. MeCabによる形態素解析

    3. 名詞のみ抽出
      (形態素解析後のデータを見ると、改行毎のセンテンス(splitelines)のカンマの後(split後ろ側)の品詞が名詞を含むとき(in)である時、そのカンマの前(split前側)の言葉を抽出)

    4. 名詞の出現頻度をカウント

    5. ストップワードのリスト作成(不要なワードのリスト:出力に反映されないワード設定)

    6. WordCloudオブジェクトの生成(ストップワードもインプット)

    7. WordCloudの生成(generate_from_frequenciesを利用)

    8. Matplotlibライブラリによるプロット(plt.imshow(wc)など)

(補足)
横棒グラフにするときには縦軸の日本語の文字化け防止のためフォント指定が必要。
 コード例:plt.rcParams["font.family"] = "MS Gothic"

■出力データ例



■入力データ(ChatGPTに3回同じような質問した結果)
青い空に白い雲が浮かび、風がそよそよと吹いています。遠くには緑の丘が広がり、
小さな川がゆったりと流れています。鳥たちのさえずりが耳に心地よく響きます。
自然の中で穏やかな時間が過ぎていく様子を感じながら、心がリラックスしていきます。
太陽が輝き、空には雲ひとつない晴れた日。広い畑には美しい花々が咲き誇り、
小川のそばでは小鳥たちが歌っています。静かな風景の中で、心地よい風が吹き抜け、
自然の音に包まれながら散歩していると、小さな村の喧噪から離れ、穏やかな時間が流れていくようです。
大都市の中心に位置する公園は、四季折々の花々で彩られ、散歩する人々に癒しを提供しています。
高いビルがそびえる中で、この緑豊かなオアシスは穏やかな時間を過ごす場所となっています。
時折、子どもたちの笑い声や噴水の音が響き渡り、都会の中でも自然の美しさを感じることができます。

この記事が気に入ったらサポートをしてみませんか?