33rdシングル5期生個人PV再生回数とかなんとか(乃木坂46)
最近はひさびさにプログラムを書いたりしているので、noteの更新は滞りがちですが、そのプログラムを使ってYoutubeから動画の再生数を抜く技を身につけたので、その結果を報告します。
まずは単純に再生回数です。2023/08/23に他の方が拾ってきた数字を使ってグラフを書いたので、そのときに数字と比較してみました。
前回はあーやがトップだったのが、アルルがトップにたってます。まああのPVだったら視聴回数伸びるのもよく分かるスバラシイ出来でした。
前回投稿したヤツはこちら。
今回は低評価の数字が拾ってこれなかったから、そいつを使ったグラフ化はヤメて、前回からの伸び率グラフを作りました。
前回比約350%のアルル圧勝ですね。それ以外のメンバーはそれぞれ約200%とほぼ同じ伸び率でした。
前回は低評価と高評価の数でグラフ化したけど、今回はコメント数が取れたので、高評価とコメント数で反応率を出してみました。
前回と比較して、全般的に反応率は落ちてます。でも元データが違うので比較はあまり意味がないかも。
そんな新しく取ってこれたコメント数をグラフ化してみました。
これで何ができるか?って問い詰められると、特にこれといってないんだけど、まあYoutubeから自分でデータが抜けたってことで少し嬉しかったってのが今回の投稿をした動機でした。
とりあえず今回使ったコードを置いときます。
言語は見ての通りPythonです。
こいつはGoogle Colaboratory上で動かしました。コードをコピペすれば簡単に動くので興味がある人は動かしてみてください。
ただし事前にYoutube DATA API v3のAPIキーの取得は忘れずに。
import googleapiclient.discovery
import pandas as pd
# APIキーを設定
api_key = '自分のAPIキー'
# YouTube Data APIのリソースを取得
youtube = googleapiclient.discovery.build('youtube', 'v3', developerKey=api_key)
# キーワードだけでは10人全てのvideo_idは自動で取得できなかったため手で調べてリストを作った
search=['w2-5lxXST9g',
'4s0p8CLINZE',
'iPRx9OWYQ64',
'Jrr5Efd5VZQ',
'sWjdK1EEgG4',
'tFPBGAGQeq0',
'pIEPFMOjQQ4',
'Ou5wLI7nFVY',
'5yKq5iQWh8w',
'yNVgr425A1I'
]
kekka = [youtube.videos().list(
part='snippet,statistics',
id=search_id
).execute() for search_id in search]
pv_01=[[n['items'][0]['snippet']['title'],
int(n['items'][0]['statistics']['viewCount']),
int(n['items'][0]['statistics']['likeCount']),
int(n['items'][0]['statistics']['commentCount'])] for n in kekka]
df = pd.DataFrame(pv_01,columns=['name','viewCount','likeCount','commentCount']) .sort_values('viewCount',ascending=False)
df.to_csv('nogizaka.csv')
csv出力を簡単にしたかったことと、抽出したデータを画面で簡単に確認したかったので、pandasをつかっていっぺんDataFrameに落としてます。
途中にsearchと名付けたリストにセットしている文字列群は、Youtubeで付番されている33rdシングル5期生個人PVのビデオIDです。「個人PV」というキーワードで引っ張ろうとしたら全員分が上手く落とせなかったので、自力で調べました。最後は力技でなんとかするタイプの仕事っぷり。
なお、グラフはNumbersで作ってます。
今回作成したCSVファイルは下のリンクから入手できるはずです。注意点としては文字コードがutf-8なので、WindowsのExcelで開くと日本語が文字化けすると思いますから、各自工夫してなんとかしてください。
追記)
Windows11環境でダウンロードしてエクセルで開いたら漢字は見事バケましたし、再生数の数字が漢字部分にくっついたので数字がただしく表示されませんでした。
で、Windows11標準のメモ帳で開いて、別名保存で"utf-8"となっている文字コードを"ANSI"に変えて保存すれば、エクセルでも正しく表示されましたよ、うふふ。
この記事が気に入ったらサポートをしてみませんか?