図1

Pythonでデータ分析〜安倍首相のツイートを分析してみた

ちょっと前まで参院選が盛り上がってましたね。

今や、多くの政党がインスタとかツイッターとか、SNSを駆使してます。

Kaggleでこんなデータがありましたので、Pythonで色々こねくらせてもらった次第です。

安部首相のツイッターアカウント「2016年-2017年」のツイート(日付、英訳、いいね数 etc.)を整理してるデータです。

ちなみに、トランプ大統領のtweetを分析したnoteもありますので、良かったら。

色々やる前に、データの整形

そのままだと、扱いづらいところもあるので、いくつか前処理をして整形。

画像1

全部で77行のデータです。

画像2

※いつものように「jupyter notebook」を使用


いつ、どのくらいツイートされてるのだろう

ってことで、まずはツイートの頻度とかタイミングをば。

①年月別のツイート頻度

2016-2017の間で年月別のツイート数をカウントしたもの。

画像3

17年10月のツイートが多いのは、言わずもがな、2017年々の参院選の影響。ツイッターも強力な選挙活動の武器なのでしょう。


②曜日別のツイート頻度

ツイートされた曜日別に集計して、並び替えたものでございやす。

画像4

「木→金→土→水→火→日→月」の順番で多い。
所謂、ホワイトカラー(平日仕事、土日休み)の有権者に見られやすい(週末に近づくほど見る?)から、かもしれない?


③ちなみに、曜日別のフォロワーの反応の違いは

各ツイートの「リプライ(replies)」「リツイート(retweets)」「いいね(likes)」がデータ内にあります。各曜日別で、上記3つの反応の平均を出してみました。

画像5

※「いいね(likes)」の平均が高い曜日順で並び替え

「リプライ(replies)」は、土曜日、金曜日、日曜日が相対的に多い?
「リツート(retweets)」は、土曜日、水曜日、火曜日が相対的に多い?
「いいね(likes)」もリツイートと同じ傾向

数字だとこちらです。

画像6


リプライ、リツイート、いいねが多かったツイート

フォロワーからの反応(いいね、リツイート、リプライ)が多かったツイートを見てみようかしら、と。

●「リプライ」が多かったTOP5

画像7

●「リツイート」が多かったTOP5

画像8

●「いいね」が多かったTOP5

画像9

リツイートといいねは一緒ですな。
↓の通り相関関係が高いからそらそうですね

画像10


★ツイートのポジネガ判定

各ツイートのポジネガ判定をやってみました。

簡単に説明すると、各ツイートに対して以下をやってます。

●そのツイートは「ポジティブ」「ネガティブ」がどちらに該当するか
●「ポジティブ」と「ネガティブ」それぞれどれだけパワーがあるか

画像11

↑の表では、左側に4つの列を追加。
・sentiment_positive →どれだけポジティブ
・sentiment_negative →どれだけネガティブ
・sentiment →ポジティブかネガティブどっちか(上記2つの大きい方)
・sentiment_net →ポジティブとネガティブのスコアの差引

こちらのやりかたは、以前、「M-1で高得点がとれる漫才」の分析をした際のこちらのnoteにやり方を記載してますので、よかったらどうぞ。


①ツイートのポジネガ割合はどうなの、と。

ポジティブなツイート、ネガティブなツイートの割合みてみた。
ほぼ、ポジティブ。

画像12


②ポジティブ【TOP10ツイートはどんなのかしら、と。

画像13

新年の挨拶、首脳会談、選挙に関して、地震や原発に関してがヒットしました。


②ネガティブ【TOP10】ツイートどんなのかしら、と。

画像14

菅元総理に関して、核、北朝鮮関連のツイートがヒットしました。


★ツイートを6つの感情で分析

ポジティブ/ネガティブだと2パターンだったので面白みに欠けたので、6つの感情(エクマン理論)を測定してみようと思います。

こちら↓のライブラリを使わせていただき、各ツイートから6つの感情を測定してみました。

angry(怒り),disgust(嫌悪),fear(恐怖),happy(幸福),sad(悲しみ),surprise(驚き)

やり方はこちら。→sentimentja: 日本語感情分析のpythonパッケージ
もしくはこちら。→コチラ

下記のように、各ツイートに対して6つの感情スコアを追加。

画像15

※列名は、
a = angry(怒り),d = disgust(嫌悪),f = fear(恐怖),h = happy(幸福),s = sad(悲しみ),su = surprise(驚き)

①6つの感情の割合はどんな感じかな

全ツイートの6つの感情それぞれのスコアを合算して、構成比出しました。
angryが相対的に多く、続いてhappyが多い。

画像16

怒りが多いのは、ちと不思議。
どんなツイートが該当してるのか、実際にみてみよう。

②「😡angry感情」TOP5ツイートはこちら

画像17

概ねangryを捉えているが、3つ目などは「選挙に対しての"アツい"ツイート」ですね。
「アツい思い」のツイートも、「こうあるべきだ!」というある種angryな感情が入ってるってことでしょうか。


③「❤️happy感情」TOP5ツイートはこちら

画像18

経済効果に関する内容や、ミスコン、プレミアムフライデーなどの内容。
ほっこり、ほのぼのします。お疲れ様です。

④「6つの感情」と「フォロワーの反応」

フォロワーの反応(いいね、リツイート、リプライ)と6つの感情の関係性(相関)がこちら。

画像19

そこまで相関係数は大きくないけど、

●happyなツイートと「いいね、リツイート、リプライ」は若干相関
●disgustなツイートは、逆相関

ってとこでしょうか。

まぁ、そらそうやわな。

はい、以上。

トランプ大統領のtweetの分析もしてるので、こちらも良かったらどうぞ。

おまけ🍡ワードクラウド作ってみた

最後に、ツイートのワードクラウドを作って遊んでみました。

①ワードクラウド

画像20

②CoolなEnglish ver.も作ってみた

画像21

以上のワードクラウドの作り方はこちら👇

ツイートのポジネガ判定と感情分析のやり方はこちら

↑の二つはこちらのマガジンに両方入っていて、お得です。

楽しんでもらえたら幸いです。

貴重なお時間をありがとうございました。

貴重なお時間で読んでいただいてありがとうございます。 感謝の気持ちで、いっPython💕