見出し画像

Tableau x Pythonでできそうなことまとめ

データ分析のBIツールTableauをおととし辺りに使ってみたのですが、かなり使い勝手がよかったので、もう少しやってみたいことをまとめてみたいです。


〇Twitter APIからデータ取得し、可視化

ツイッターのAPIからデータを取得し、データを可視化できるのだとか。複雑なスクリプトを書かずともできそうなので、これは試してみたい。

〇Web Data ConnectorでAPIっぽくデータを取ってくる

Web Data Connector (WDC)を利用すると、自作でデータ取得ができるページができるらしいですね。GASでHTML作って、実装みたいなこともできるのかな?


〇データの前処理

TableauはBIツールなので、データの前処理はちょっと微妙っぽいです。

前処理に関しては、以下のことができそうです。

・欠損値削除
・文字列削除
・スペース削除
・各テーブルをJOINさせる

特徴量を新しく作成することができなさそうです。この辺に関してはPythonでさくっと前処理したほうがよさそうです。

〇 Python連携

データの取得から、機械学習した結果をグラフ表示みたいなことも、Tabpyを使うとできます。基本的にデータ取得から前処理までを実行しちゃって、処理結果はインタラクティブにTableauで統合しちゃう感じがよさそうです。特定の処理をまとめておいて、例えばアカウント名変えるだけであるユーザーの人気のツイートとかを可視化したりできるみたいです。ただし有償版Tableau Desktopを利用しないと厳しいそうで。。。


〇ダッシュボート公開

取得したデータのビジュアライゼーションをしたものをダッシュボードに公開できる。これはTwitterのデータを可視化しているダッシュボードです。あるアカウントについてもっともつぶやいたアカウントトップ10とか、最もバズったツイートトップ10とか。

〇所感

Tableau上でPythonを動かして、Matplotlibでやるような探索的な分析とか、レポーティングに必要な可視化に関してはTableauでサクッとやってしまうのがよさそうですね。ただ、実行処理とかがちゃんと結果が見えるのかがよくわからないので、Tabpyを試してみようと思います。

おそらく、データが整っていて、複数のデータソースがあるみたいなときに探索的にデータを見るような場合は重宝しそうですね。Analyticsのデータ連携とかが非常によさそうです。(Pythonは使わなさそうですが。)

サポートでいただいたお金はFanzaの動画を購入するために利用されます。