Google アナリティクスでページ(含むイベント)閲覧順に集計したレポート群の仕様についての完全ガイド

私は10年間(2008/2~2017/12)ほぼ毎週Web担当者Forumで連載を続けた衣袋(いぶくろ)という者で、Google アナリティクスの設計や設定、分析と教育の専門家だ。このnoteでは、私が定期開催している丸二日のGoogle アナリティクス講座でも話したことがないくらい細かい話題を、有料で提供している。

タイトルにある「ページ(含むイベント)閲覧順に集計したレポート群」とは、具体的に下記レポート群、あるいは、ディメンションを選択したカスタム レポートを示している。相互に関連するレポートも多数あり、本稿の範囲は広範に亘ることになった。断片的に知っていることもあるかもしれないが、私自身、包括して一気に理解を深めるよい機会となった。

・「ユーザー > ユーザーフロー」レポート
・「行動 > 行動 フロー」レポート(「イベント」「コンテンツグループ」含む、すべての表示タイプ)
・「行動 > サイト コンテンツ > ランディング ページ」レポートの「入口からの遷移」タブ
・「2ページ目」ディメンション
・「行動 > サイト コンテンツ > すべてのページ」レポートの「ナビゲーション サマリー」タブ(「コンテンツグループ」含む)
・「前のページ遷移」ディメンションと「次のページ遷移」ディメンション(「ナビゲーション サマリー」タブのものとは異なる)
・「前のコンテンツ グループ」ディメンションと「次のコンテンツ グループ」ディメンション(「ナビゲーション サマリー」タブのものとは異なる)
・「行動 > イベント > イベント フロー」レポート
・「コンバージョン > 目標 > 目標パスの解析」レポート
・ただし、「集客 >ソーシャル > ユーザーフロー」レポートは対象外

なお「次のページ遷移」ディメンションと「次のコンテンツ グループ」ディメンションは廃止と宣言されているが、まだ選択でき、使用が可能になっているので触れている。

但し以下は対象外とする。その理由は、閲覧行動が直接前後の順番で紐付いてないレポート(どのページまで到達したかを段階的に見るレポート)で、上記のレポート群と比較して整合性を確認すべき対照とはならないからだ。

・「コンバージョン > 目標 > 目標到達プロセス」レポート
・「コンバージョン > 目標 > ゴールフロー」レポート
・有料版のカスタム レポートの「カスタム ファネル」タイプのレポート
・拡張eコマース利用時における「コンバージョン > eコマース > ショッピング行動」や「決済行動」レポートなど

本稿は対象となるそれら似たレポート群の正しい読み解き方(集計仕様)を解説したものだ。多くのレポートで微妙に数字が異なっていたりしていて、集計仕様や表示されている数字の定義を正確に理解している人は殆どいないだろう。ページビュー数ベースなのか、ページ別訪問数ベースなのか、セッションベースなのか、ユーザーベースなのか、はたまた従来の指標の算出とは異なるのロジックでカウントされた値なのか、ご存じだろうか。

これら各レポートの数字が異なったりするのは、決してバグなどではなく、すべて個々の集計仕様に基づいた再現性のある集計がされていると考えた方がよい。それらを逐一説明し、活用事例的な話は一切ない。

また、細かい数字の違いに興味のない人には役に立たない。細かいことを気にしなくても、各種レポートを見て、データから改善施策を考え実行し、成果を出しているならそれで十分だ。しかし、クライアントや上司へ細かい集計ロジックなどをきちんと説明して納得してもらえないと、なかなか提案の根拠として認めてもらえない、そういった迷えるマーケターやアナリストが読んでくれればよい。

なお本稿で取り上げないと書いた「コンバージョン > 目標 > 目標到達プロセス」レポートに関しては、筆者のWeb担当者Forumの記事などを参照して欲しい。こちらも殆どの人が、よく分かっていないで使っているレポートだからだ。関連するアナリティクス ヘルプにも詳細が書いてあるが、これも読んだ方は殆どいないと思うので、併せてリンクを掲載しておく。

目標到達プロセス レポートとゴールフロー レポートの比較(アナリティクス ヘルプ)
カート落ちの原因は何? GAの「目標到達プロセス」でボトルネックのページを見つける方法[第48回](衣袋教授の新・Googleアナリティクス入門講座)

本記事の主な対象者:サイト内での訪問者のページ間の行動の繋がりやイベントの発生ページ状況などの細かい動きを知ることが重要なマーケターや分析担当者など。

前提とする知識:「ページ」「ランディング ページ」「離脱ページ」「コンテンツ グループ」などの主要なディメンション、「ユーザー」「セッション」「ページビュー数」「ページ別訪問数」「閲覧開始数」「直帰率」「離脱率」などの主要な指標の定義を理解していること。「イベント」とは何か理解していること。フロー系レポートを見るための各種操作方法を知っていること。

前提とする実装や設定:「コンテンツ グループ」が関係する部分は、「コンテンツ グループ」を収集するためのトラッキングコードの実装や諸設定がしてあること。「コンバージョン」が定義されていないと表示されないレポート群については、「目標」を設定してあること。「イベント」が関係する部分は、「イベント」を収集するためのトラッキングコード実装がしてあること。

本記事の対象外:対象とするレポート群を分析することで具体的な施策に生かせる分析方法やアイデア、具体的な事例に興味を持っている方にはあまり役に立たない。それら活用の前提としての各種レポートやディメンションについての集計ロジックについて書いてあるだけだからだ。

目次:
1.「ランディング ページ」と「2ページ目」ディメンション
2.「ユーザーフロー」レポートの「開始ページ」と「最初の通過地点」
3.任意のページの前後のページ閲覧は「ナビゲーション サマリー」で
4.「次のページ遷移」ディメンションは廃止とあるが・・・
5.「行動フロー」レポートで任意のページの前後のページ閲覧を見る場合
6.「コンテンツ グループ」を設定している場合
7.「イベント」が含まれる場合
8.「目標パスの解析」レポート


<「ランディング ページ」と「2ページ目」ディメンション>

まず、分かりやすい所からいこう。「ランディング ページ」はセッション(訪問)の最初に閲覧したページのことで、この1ページでセッションが終了した場合は直帰セッションとなる。セッションが継続して、次のページ閲覧に繋がったら、そのページは「2ページ目」ディメンションのページに割当てられる。念のため例を示しておこう。

例)下記2セッションのページ閲覧行動が以下だったとする
セッションX:ページA ⇒ ページB ⇒ ページC
セッションY:ページD ⇒ ページE

この例における、「ランディング ページ」と「2ページ目」ディメンションの値は以下の通りだ。
セッション  ランディング ページ  2ページ目
セッションX    ページA     ページB
セッションY    ページD     ページE

Google アナリティクスのレポートで言えば、「行動 > サイト コンテンツ > ランディング ページ」レポートで、セカンダリ ディメンションで「2 ページ目」ディメンションを選択すれば(図1)、ランディング ページと2 ページ目の組合せで、何セッション(訪問)あったのかといったレポートを確認することができる(図2)。

なお「2 ページ目」ディメンションの値が「(not set)」(図2ではデータの1行目)というのは、「2 ページ目」の値が存在しない場合、つまり直帰セッションの場合の表記になる。

また「2 ページ目」の値がランディング ページと同じ場合(図2ではデータの2行目)がよくあるが、これは同じページのリロードの場合や、セッションが切れず一度サイトの外に出てから再び同じページを閲覧した場合(ノーリファラーで入り直すとセッションが切れないので)などが該当し、特におかしな現象ではなく結構普通にあることなので、自分のサイトのデータなどでも確認してみて欲しい。

続いて、この「2 ページ目」ディメンションの値を確認できる標準のレポートをもう一つ紹介しておこう。それは、「行動 > サイト コンテンツ > ランディング ページ」レポートの「入口からの遷移」タブだ。

図3はそのレポートで、ランディング ページを「 / 」(トップページ)と選択した場合の表示になる。つまり図2の1行目から6行目のデータに対応しているはずだ。図2と図3を比較して分かるのは、「2 ページ目」ディメンションの値が「(not set)」、つまり直帰を除いたデータが、図3の「入口からの遷移」タブのレポート対象になっていることがわかる。

そして図3の右端の列の「セッション(%)」は、これら直帰を除いた対象の合計セッション(図3の例では7セッション)を100とした場合の割合を表示している。


<「ユーザーフロー」レポートの「開始ページ」と「最初の通過地点」>

続いて、「ユーザー > ユーザーフロー」レポートをみていこう。「ユーザーフロー」レポートでは、「開始ページ」と「最初の通過地点」ディメンションがあるので、これは「ランディング ページ」レポートにおける、ランディング ページと2ページ目の組合せを確認できるレポートであると想像できる。

フロー系のレポートは基本的に行動ステップ順に時系列に右側に進んでいくように眺めるレポートで、各ステップは基本的に上位5つのページ(群)とその他の合計6種類ずつ表示されており、サンキー・ダイアグラムと呼ばれる表現方法で作図されている。セグメントも掛けることができる。

そこでさっそく同じ集計対象期間のレポートで数値を比較してみよう。図4を概観すると、まず左上は「国」ディメンションが選択されているが、どこから来たのかといった参照元と組合せたりすることもできるのが、左端の列。2つ目の列が「開始ページ」つまり、ランディング ページのディメンションの値が表示されており、3つ目の列が「最初の通過地点」つまり、2ページ目の閲覧ページが表示される、といったレポートだ。

なお図4は、「開始ページ」が「 / 」のノード(緑色の部分の名称、経由したポイント(ページやイベントなど)のこと)をクリックして表示させた機能の「ここをハイライト」(図5)をクリックして、ランディング ページがトップページのセッションが強調されるように表示させてわかりやすくしておいた状態だ。

「開始ページ」の列の直下には、セッション数83(図4の中央上、図5の左上)とあり、対象期間の総セッションが83であることがわかる(図2右上の全体のセッションとも同数)。そして図4でハイライト表示した部分の「 / 」のノード表記を見ると、トップページがランディング ページになったセッションが15であるということを示している。ユーザーフローの集計のベースは間違いなくセッションベースだ。

さらに、「開始ページ」が「 / 」のノードの右側にある赤い表示部分(図6黒枠部分)をマウスオーバーすると、左側に「10 / 10離脱数」という表示がでてくる(図6)。これで比較するデータが揃ったので、「ランディング ページ」レポート(図2)と「ユーザーフロー」レポート(図4、図6)を比較し、データの整合性をチェックしていこう。

「ユーザーフロー」レポート(図4、図6)を一覧表にまとめてみると以下のようになる。
開始ページ   最初の通過地点  セッション数
/        離脱        10
/        /info/book/12096  2
/        /info/news/12178  1
/        その他       2

一方、「ランディング ページ」レポート(図2)は以下だ。
ランディング ページ  2ページ目  セッション数
/          (not set) 離脱    8
/          /           2
/          /info/book/12096  2
/          /info/news/12178  1
/          /?s=流入      1
/          /category/basic   1

この二つを比較しただけだと「ユーザーフロー」レポートでは「直帰」と、「同じページの繰返し閲覧」のどちらもが「離脱」扱いになるのかと思えるのだが、「ユーザーフロー」レポートの「その他」の中身がよくわからないので確信が持てない。念のためユーザー エクスプローラで1件ずつチェックしたところ、実はそうでなかったのだ。

「ユーザーフロー」レポートでは、3ページ目4ページ目の閲覧データも表示してくれるので、該当する15セッションの閲覧明細を全部突き合わせた結果、意外な集計処理がされていることがわかった。ポイントは以下の三つだ。

この続きをみるには

この続き:13,275文字/画像30枚

Google アナリティクスでページ(含むイベント)閲覧順に集計したレポート群の仕様についての完全ガイド

衣袋 宏美

3,980円

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

3

衣袋 宏美

コメントを投稿するには、 ログイン または 会員登録 をする必要があります。