見出し画像

TikTokの視聴履歴やいいね履歴をみてみた

TikTokを見ていて今までどのぐらいの動画を見たのか気になっていたところ、自身のログデータをダウンロードできるようなので、確認してみた

データのダウンロード方法

ダウンロードにあたって、以下の申請のステップを踏む必要がある

画像1
画像2


上の5つ目のキャプチャで、TXTとJSONのどちらかを選択できる。解析のしやすさからJSONを今回選択した
なお、申請(Request data)から3日ほど経つとInboxに通知が来てダウンロードが可能になる。注意として、ダウンロード可能になってから4日ほどで期限切れ(Expired)となる


データの全体概要

中身の大枠としては以下となる

▼Activity
・お気に入りに入れたエフェクト/ハッシュタグ/曲/動画
・フォロワー/フォロー履歴
・自分が投稿した動画につけたハッシュタグの情報
・いいね履歴
・ログイン履歴
・購入履歴
・検索履歴
・シェアした履歴(ちょっと不確か)
・動画の視聴履歴

▼Ads and data
おそらくTiktokのパートナー企業についての情報

▼App Settings
アプリ内の設定や、自分がブロックしているアカウント情報

▼Comment
自分がいつどんなコメントしたかの情報
ただ、どの動画にコメントしたかの情報は入っていない

▼Direct Messages
ダイレクトメッセージ

▼Profile
自身のアカウント情報

▼Video
自分が投稿した動画の投稿日時とLike数

この中から、今回はActivity内のフォロー履歴、いいね履歴、視聴履歴をみていく

以降の可視化では、Pythonのデータ分析ライブラリであるNumpy, Pandas, Matplotlib, Seabornあたりを使用した。時刻については、解析結果から時間がずれていたので日本時間(+9h)に直した。Tiktokの言語表示設定を日本にしている場合、この処理は特に不要かもしれない


フォロー履歴

以下のように時刻とユーザー名で構成される。UserNameが空欄のものがあるが、これはUserNameが初期値/未設定のものだと考えられる(実際に該当するユーザを見てみると数字の羅列になっていた)

画像9

以下は「年間のフォロー数」と「フォローする時間帯」を表すチャートである。左図の横軸は年、縦軸はフォロー数を表している。また、右図の横軸は時間、縦軸はフォロー数を表している
2021年のフォロー数は過去2年分の2倍以上フォローしていることがわかる。また、早朝が少ないことから私自身の体感値と合致している。

画像9

次に、月毎にどれぐらいフォローしているのかを以下で可視化してみた。今年の1, 2月のフォロー数が多く70以上となっている。次いつおすすめに出てくるかわからないため、少し良いと思ったらフォローしておこうという心理がこの時期強かった記憶がある。加えて、視聴時間がこの時期多かったという点もある

画像9


いいね履歴

以下のように時刻といいねした動画で構成される。ただ、2020年1月からのデータとなっており、それ以前のデータが確認できないことがわかる。つまり、それ以前からTiktokを利用していたユーザーは、自身が一番最初にいいねした動画がどういった動画か見ることができないことになる(悲しい)

画像9


次に、フォロー履歴と同様に可視化。今年の8月中盤までのデータを使用しているが、今年のいいね数はすでに昨年1年分のいいね数である15000いいねを超えていることがわかる。また時間帯ごとのチャートについては、フォロー履歴の分布と大まかな傾向は同じ

画像9

続いて、年月毎の結果が以下である。ピークである今年の1月は4000近くもいいねをしており、1日あたり平均で130いいねしたことになる

画像9


視聴履歴

順序が逆な気がするが、視聴履歴は個人的に一番気になっていた情報のため、あえて最後に持ってきた。何秒閲覧したら視聴カウントされるか不明だが、動画が再生された時点でカウントされると捉えるのがベターだろう。そのため、再生履歴と呼ぶ方が適切であろう

いいね履歴は2020/1月からだったが、以下を見ると視聴履歴は2020/2月からになっている。即ちそれ以前から使用している人は、一番最初に見た動画が確認できないのと、はじめてから今までの全視聴数がどれぐらいか確認できない(非常に悲しい)

画像9

2019/1〜2020/2月中盤までのデータが仮にあったとすると、おそらく全体で10万以上の動画は少なくとも再生していると考えられる

同様に年間の再生した動画の数と、時間ごとの再生数を以下で可視化。今年の8ヶ月間ですでに45000動画を再生していることがわかる。時間帯としては夜の11, 12時あたりの視聴が最も多い

画像10

続いて、年月毎の結果。今年の1月が突き抜けて多く、11000動画ほどスワイプしている。1動画15秒と仮定し、フルに見たとするとこの月は45時間程度見ていたことになる。実際は再生した時点でカウントしたと考えるのが妥当なため、そこまでではないだろうが。。

画像11

加えて、2020年1月の日毎の視聴数を以下で可視化してみた。800を超える日が1日だけあった。また、この日は全データの中で最も視聴数が多い日である。先程同様に計算するとこの日は3時間ほど見ていることになる。

画像12

今年の1月が異様に多い要因として、今年の初めあたりからTiktokライブが盛り上がり、アプリそのものに食いついている時間が長かったことが考えられる。(ライブ機能自体は2020年の終盤には既にあった)


続いて、曜日ごとの視聴数も以下で可視化してみた。横軸の0~6が月〜日曜に対応する。当然ながら土日が多い。平日では木曜(3)が他の平日より少し多い結果となった

画像13


いいねの割合

自分はどのぐらいの割合でいいねをするのかが気になったため、こちらも確認してみる。その際、いいね履歴と視聴履歴の開始地点がそれぞれ異なっていたため、どちらも2020/3月に揃えた。

計算してみたところ、平均で0.375、つまり4割の動画にいいねをしていることがわかった。また、以下で年月ごとの割合を可視化した。縦軸は視聴数に対するいいねの割合で、今年は0.4付近の月が多い

画像14


上のチャートから、月によって割合が上下しているところがあり、その時の気分がいいねの押す数に影響/相関しているのか気になった


おわりに

これだけの視聴履歴や行動履歴があれば、自分がどういう選好をしているのか、アルゴリズムは容易に判断できるのではないかと思う。数の暴力に加えて、動画のどのタイミングでどういうアクションをしたか(再生停止/スワイプ/いいね/リンクコピー/繰返再生等)の情報も利用できるとしたら、かなりレコメンドの質も上がるのではないかと思う

ユーザの選好についてBotを用いた検証があるようで、平均で2時間以内には適切なレコメンドができたとのこと。映画だとたった1本分、ドラマだとたった2話分の時間となる。映画やドラマを配信しているNetflixなどはユーザーの好みを掴むのにどのくらい時間かかっているのだろうか


さいごに、ショートムービーによるデータ取得とレコメンドAIの相性の良さはバツグンということを改めて認識した。そして、Homo Deusの著者Harariが主張するDataismや“An algorithm that knows you better than you know yourself”は既に起きはじめているのかもしれないと思った。これに対し、Web3の勃興によりデータの所有権を人々の手に戻すことで、どこまで自身のプライバシーをAlgorithmに払うのかという交渉の余地が生まれているのが面白いなと思った。

おしまい

この記事が気に入ったらサポートをしてみませんか?