見出し画像

PowerBI入門

PowerBI 王子の清水優吾さんの書籍が出たのでPowerBIに興味があったので買ってみました!

BIの目的はデータを可視化することではありません。可視化は手段であり、その目的はユーザーに意思決定可能なネクストアクションの機会を提供すること。経営手段の仕組みづくり。

JSONやXMLからテーブル形式へ変換しなければならない。ETL (Extract 抽出、Transform 変形・変換、Load 読み込み)と呼ばれる処理のTransformにあたる。

セマンティックデータモデルの構築(業務的に意味のあるデータモデルを構築すること)が可能なツールはモデルベース型(model-based tool)と呼ばれる。1つまたは複数のデータソースを読み込んで最終的に1つのテーブルに集約するようなその他のBIツールはレポートベース(report-based tool)と呼ばれる。

BIとは何かの共通事項
知りたいこと、興味・関心。状況によって興味・関心は変わる。興味・関心のあることを人は知りたい。
一目でわかること。電光掲示板のようにパッとみて誰でも分かるようになっている。
ネクストアクションがある。見た人のその情報によって左右される次の行動(ネクストアクション)がある。判断しなければならないことがある。

BIとは、「あなたが興味・関心のあることをやり、その経験から知恵を得ること」または「その経験から得た知恵

決まったタイミングで見るデータ、分析目的のレポート。「締め」処理の対象となるデータ。分析目的のデータ。業務で必要とされているレポートの9割がこのタイプ。

Power Queryエディターの上部にグラフが表示される。デフォルトではオフになっているため、リボン[表示] - [データのプレビュー] にある [列の品質] と [列の分布]にチェックを入れる。

PowerBIには、日付(Date)型日時(DateTime)型の列を見つけると、自動的に内部で日付テーブルを作成するタイムインテリジェンス機能がある。自動で日付テーブルが作成されると、年/四半期/月/日という階層が作成される。

PowerQueryエディターでデータを編集しても、データソースには影響を与えない。データを読み込んでコピーしているので、元のデータには影響を与えないようになっている。

PowerBIのモデルでは、2つのテーブル間で有効なリレーションは1つのみ。

値の置換をする。例えば、ハイフン( - ) を不明と置換したりして、分かりやすいデータにする。

日付テーブルに必要なのは、日付の抜けがなく、日付が一意になっているテーブル。365行以上は必要になる。連続した1年分が揃っていれば良い。

行数をカウントする、COUNTROWS関数

PowerBIのグラフは、日付テーブルとのリレーションが適切に設定されていれば、軸に日付を指定することで、値は日付ごとに集計される。累計値もDAXで表現できる。

1週間の間隔6を指定して集計をする。前週との比較-7で比較できる。

円グラフの凡例はデフォルトだと右中央が、左中央に変更した方が見やすい。不要な軸のタイトルは非表示にする。情報の取捨選択を厳密にする。ノイズになりそうなものはとにかく無くす。引き算で考える。

スケジュール更新は、デフォルトだとオフ。PowerBI Proだと8回/日が上限。PowerBI Premiumは、48回/日が上限。更新が始まる時刻を指定する。集計に時間かがかかるため、何回かやって調整するといい。

できあがるデータモデルは、そのデータのビジネスを表している。データモデリングは、ビジネスアナリストやビジネスユーザーの仕事。
覚えるのではなく、考える。

PowerBIにおいて、テキストが表示できるということは、データを表示できることを意味する。文字列に値も一緒に表示して便利なタイトルなどつけられる。

色の指定、フィールドに基づいてルールベースで色の指定ができる。信号のイメージなどできる。

PowerBIの入門に、概念からわかりやすく書かれていて、とても参考になります。PowerBIでなくてもBIについての概要も把握できるので、一読するとレベルが上がると思います。BI入門には、とてもおすすめの1冊です。



この記事が参加している募集

読書感想文

この記事が気に入ったらサポートをしてみませんか?