Tableau Prep Builder とは

初めに

 DATA Saber挑戦中のTakahiro Hiroshimaと申します。
 DataSaberの試練に挑戦する中で、Prepと言う名前を耳にすることが多く、私自身どんなことができるか気になっていたので、調べてブログにまとめてみました。
 まず、Tableau Prep Builder(以下Prep)って何ができるの?といった疑問に一言で答えると、「データの前処理ができる」と言った回答になります。
?????となる方も少なくないのではないでしょうか?
 安心してください。私もその中のうちの一人です。
 逆に前処理を経験したことがある方も、どの程度の前処理ができるか気になったのではないでしょうか?
 今回はそんな疑問にお答えするべく、以下の順番で説明していきたいと思います。興味のある方は見てみてください。既に何度か使ったことがある方や前処理歴の長い方は読んでもあまり身にならないかもしれません。(笑)

  1. データの前処理とは

  2. Prepの特徴について

  3. 基本的な機能について

1. データの前処理とは

 データの前処理とは何かわからない人に向けて、具体例を一つ上げてみたいと思います。

例)拾ってきた緯度経度のデータをExcelを用いてgooglemapに読み込ませられる形にしたい場合。
 拾ってきた形が「35/42/20.24  139/45/6.91」だった場合。(今回は東京ドームの緯度経度を利用)

 まずgooglemapに読み込ませるには最終的に「35°42'20.24"N 139°45'6.91”E」の形にする必要があります。
 他の方法もあるかもしれませんが、私が一番に思いつく具体的な手順は以下の手順です。

① 別の列へ/で分割
②できた列の間に空白の列を必要な列数挿入
③北緯側に「°」「’」「”」「N」東経側に「°」「’」「”」「E」を記入
④CONCAT関数を用いて北緯と東経をそれぞれ結合
⑤結合によりできた空白を削除←空白とタブが混同していてなかなか面倒

 こうしてようやく「35°42'20.24"N 139°45'6.91”E」になります。東京ドームだけなら手で変えちゃえば早いじゃんと思うかもしれませんが、大量にピンを立てたい場合はそうもいきません。

実際のエクセル画面

 実際のExcelの画面を貼り付けしてみましたが、ぱっと見では何をやってるかよくわかりませんよね。(小さくてすみません。)
 こう言ったブラックボックス化しやすい所を綺麗にフロー化してくれるのがPrepです。

 今回はgooglemapに読み込ませるための前処理を例に上げてみましたが、これをTableauに読み込ませるために最適なツールがPrepです。では、実際にどのような特徴があるのかを見ていきたいと思います。

2. Prepの特徴について

 特徴は大きく分けて以下3点です。

  • ドラッグ&ドロップの直感的な操作でデータの整形が行える

  • データの分布や処理フローを確認しながら、データの整形が可能

  • データの整形処理の効率を圧倒的に高めてくれる


実際のTableau Prep Builderの画面

 このように「どんな処理」を「どの順番で」行なっているか一目で見ることが可能です。人がExcelで行った前処理を後から別の人が見ても意味不明なパターンが多いですが、このようにフローかしていてくれると後から見る側も理解しやすいですね。また、実際に人が作った前処理のフローを見ることで、新たな発見に繋がり、自身の勉強になりやすい点も大きな特徴の一つと言えるかもしれません。

3. 基本的な機能について

 基本的機能は大きく分けて7つです。

  1. データ接続

  2. クリーニングステップ

  3. ユニオン

  4. 結合

  5. 集計

  6. ピボット

  7. 出力のフローの保存

一つずつ簡単に説明すると
1. データ接続
 ExcelやcsvのデータをTableau Prep Builderに接続する機能

2. クリーニングステップ
 範囲の広い機能。データ表記を揃えたり、間違っているデータを削除したりできる。

3. ユニオン
 同じ出力のデータを縦に連結する。

4. 結合
 異なる項目のデータを横にくっつける。

5. 集計
 日付別のデータを月別で集計させることができたりする。

6. ピボット
 Tableauで認識しやすい構造に行列を変えたりする。

7. 出力とフロー保存
出力:Prepで変更したあと、他のツールにつなげられるようにする。
フロー保存:処理をフローとして保存し、同じ構造のデータに再利用でき
      る。(例)月別の売上データなど

 DATA Saber技術試練では1,3,4,5,6について扱う試練が用意されているので、これらについては試練に挑戦された方ならば見覚えがあるのではないかと思いますので、次回のブログでは実践的な使い方の解説や、2のクリーニングステップについての深掘りもしていけたらと思っています。

 他にもいくつか機能があるので、深掘りしていきながら、私自身もTableau Prep Builderの知識とスキルを身につけていきたいと思います。
 私自身の知識整理目的のブログですが、皆さんの学習の助けにもなれれば非常に幸いです。

以上!今回は
1. データの前処理とは
2. Prepの特徴について
3. 基本的な機能について
の三つをまとめてみました。

 慣れないブログ投稿で、文章ぐちゃぐちゃで申し訳ございません。もし最後まで読んでいただけた方がいらっしゃいましたら、感謝です。ありがとうございました。
 次回は実際の画面を見ながら解説していければと思いますので、興味のある方は見てみてください。 

この記事が気に入ったらサポートをしてみませんか?