Google アナリティクスの「新規ユーザー」と「新規セッション率」の集計仕様

私は10年間(2008/2~2017/12)ほぼ毎週Web担当者Forumで連載を続けた衣袋(いぶくろ)という者で、Google アナリティクスの設計や設定、分析と教育の専門家だ。このnoteでは、私が定期開催している丸二日のGoogle アナリティクス講座でも話したことがないくらい細かい話題を、有料で提供している。

今回は『Google アナリティクスの「新規ユーザー」と「新規セッション率」の集計仕様』ということで、「新規ユーザー」と「新規セッション率」の二つの指標の集計仕様について解説する。

プロパティの管理項目である「プロパティ設定」の中に「レポートでユーザー指標を有効にする」(以降は「ユーザー指標」と省略する)のオンオフを切り替えられる機能が2017年夏あたりで実装された。もし、まったく知らないという方がいたら、まずは私の連載記事の、下記を一読して欲しい。一部、この執筆時点から仕様変更があるが、概要を掴むには手頃だろう。

【速報】GAにこっそり増えていた重大な新機能「ユーザー指標」とは? 今すぐに有効にするべきか否か(Web担当者Forum)

そして、記録していないので正確にはわからないが、恐らく有料版も含めてすべてのプロパティで、この「ユーザー指標」の設定が、あるタイミングで特にお知らせもなく、オフの状態から強制的にオンに変更されたはずだ(ただこの機能を一度オンにして再びオフにしたなど、何らかの操作をしたことのある場合には強制移行されていない、といった具合ではないかと推察している)。皆さんのGoogle アナリティクスでの設定がどうなっているのか、確認しておくことをお薦めする。

この機能をオンにすると、幾つかのレポートで表示される指標のセットが従来のセットから変化する。それを気がつかない利用者の方もたくさんいるようで、無料の広告主コミュニティで「ある指標の数字のトレンドが大きく変わったのは何故か?」であるとか、「新規ユーザーっぽい指標の数字がいろいろあるけど、微妙に数字が違っていてどれを使えばいいのか?」などといった質問をよく見かけるようになった。それが本稿をまとめるきっかけになっている。

なお関連して、別のディメンションの値についても、不可解な集計がされているということも併せて解説している。実はこれが「新規ユーザー」と「新規セッション率」の二つの指標を正しく理解するための鍵を握っているからだ。

本記事の主な対象者:基本指標の根幹部分の話なので、Google アナリティクス利用者すべて。

前提とする知識:ユーザー、セッション、ページビュー、イベント、ヒットなど、ごく基本的な概念の意味が正しくわかっていること。「ユーザー」「セッション」「ページビュー数」などの基本的な指標の計算方法の基礎を理解していること。「新規とリピーター」レポートの見方の基本は理解していること。イベント トラッキングの非インタラクション ヒットを理解しているとなお可。

前提とする実装や設定:どのサイトでも生じる可能性のある話なので、特に条件はない。また、「ユーザー指標」の機能がオンとオフの両方の場合について解説してあるので、双方に対応している。なお、すべての実例はサンプリングが掛かっていない集計が前提となるので、数字が食い違う原因として「サンプリング」の要因はあらかじめ排除してある。

本記事の対象外:「新規ユーザー」と「新規セッション率」の二つの指標をどうビジネスに活用したらよいのかに興味を持っている方にはあまり役に立たない。それら活用の前提としての集計仕様についてなるべく正確に書いただけだからだ。

本記事の注意事項:副次的に「ユーザー」指標(ユーザー数)についても言及しているが、その集計仕様については殆ど検証不可能なので、正確性については保証の限りではない。

目次:
1.不思議な集計の例
2.「ユーザー>概要」レポートの円グラフ
3.おかしな集計が生じる原因
4.新規ユーザーと新規セッション率の集計仕様
5.新たに浮上した「ユーザー」指標の謎
6.「ユーザー指標」がオンとオフの場合別ベストプラクティス


<不思議な集計の例>

まず、どの数字を使ったらよいのか、迷う具体例をいくつか紹介しておく。皆さんのサイトの計測の場合では、どうなっているだろうか。図1は「ユーザー指標」の設定がオンになっている場合の、「ユーザー>概要」レポートの一部で、図2は同じ期間の「ユーザー>行動>新規とリピーター」レポートの一部だ。

この例だと、「新規ユーザー」数指標として使えそうな数字は、3つあるのではないだろうか。具体的には50,239、50,297、50,403の3つだ(図1黒枠部分、図2各枠部分)。「ユーザー>概要」レポートに表示されている「50,239」(図1黒枠部分)は、「ユーザー>行動>新規とリピーター」レポート(図2)の全体数字の下段に控えめに表示されている括弧内の数字(図2赤枠部分)と同じであることもわかる。

もう一つ(図3)は少しひねった例ではあるが、実際の例だ。不思議な箇所が顕著にわかるようにカスタム レポートを作って、その画面を表示したものだ。

「ユーザー」と「新規ユーザー」指標の列を見比べてみて頂きたいが、「新規ユーザー」数が「ユーザー」数よりも大きい(図3黒枠部分)なんていうことが起こっていいはずがないとすぐに気がつく。また「新規セッション率」と「セッション」指標の列を見て頂きたいが、新規セッション率は60%なのだろうか、それとも70%、はたまた80%なのだろうか(図3赤枠部分の3カ所)。

こういった現象というか、こういうことが生じる集計ロジックについて解説していく。けっして再現性のないバグでもなく、再現性のある集計ロジックがある。サンプリングも関係ない場面での集計ロジックだ。


<「ユーザー>概要」レポートの円グラフ>

続いて「ユーザー>概要」レポートの円グラフについて説明する。冒頭に紹介した記事(下記にリンクを再掲載)にも書いてあるが、関連する重要な話なので、省略せずに改めてここで説明しておく。

【速報】GAにこっそり増えていた重大な新機能「ユーザー指標」とは? 今すぐに有効にするべきか否か(Web担当者Forum)

簡単に言ってしまうと、「ユーザー指標」がオンでもオフでも、「ユーザー>概要」レポートの円グラフに表示される割合は、「ユーザー>行動>新規とリピーター」レポートの一番左列の指標における、ユーザータイプ別(New VisitorとReturning Visitor)の割合が利用されていると言える。しかし「ユーザー指標」のオンオフを切り替えると、一番左列の指標が変わるので、円グラフに表示される数字も異なる指標になっているということだ。

まず「ユーザー指標」がオフの場合が図4と図5だ。図4の「ユーザー>概要」レポート右の円グラフのNew VisitorとReturning Visitorのシェア割合の数字(図4黒枠部分)は、図5の「ユーザー>行動>新規とリピーター」レポートの一番左列の指標、つまりこの場合は「セッション」指標のユーザータイプ(New VisitorとReturning Visitor)別の割合、すなわち78.66%と21.34%(図5黒枠部分)が四捨五入されて、78.7%と21.3%と表示(図4黒枠部分)されている。

一方「ユーザー>概要」レポートの「新規セッション率」(図4赤枠部分、「ユーザー指標」がオンの場合は表示されない)は、少々わかりにくいが、実は「ユーザー>行動>新規とリピーター」レポートの「新規セッション率」指標の全体の数字の「ビューの平均」の方(薄く小さく表示されている)の数字(図5赤枠部分)に対応している。

通常この2種類の数字の差は殆どないので、「ユーザー>概要」レポートの左側の新規セッション率の表示(図4赤枠部分、78.62%)と、右側の円グラフで示されている数字(図4黒枠部分、78.7%)との不一致(78.62%を四捨五入してもグラフの78.7%にならない)は気がつきにくいし、「ユーザー>行動>新規とリピーター」レポート(図5)でも小さく薄い表示なので、2種類ある数値とその差に気がつく人も殆どいなかったのではないだろうか。

続いて「ユーザー指標」がオンの場合が図6と図7だ。図6の「ユーザー>概要」レポート右の円グラフのNew VisitorとReturning Visitorのシェア割合の数字(図6黒枠部分、94.4%)は、図7の「ユーザー>行動>新規とリピーター」レポートの一番左列の「ユーザー」指標のNew VisitorとReturning Visitorのシェア割合(図7黒枠部分)を表示している。つまり「ユーザー指標」がオフの場合に使用していたシェア割合とは違うものが使われているのだ。

しかし、足して合計にならない「ユーザー」指標を、単純合計した分母に対してそれぞれのシェアを出すなんていうバカなことはしてはいけないので、円グラフでそういうシェアを見せるのは明らかにミスリードさせる表現方法であるので、こちらは決して使って欲しくないグラフだしデータだ。

言っていることはわかるだろうか。New VisitorとReturning Visitorの区分は、セッションの分類だ。New Visitorは初回訪問セッションを、Returning Visitorは2回目以降訪問セッションを区別するもの。ユーザーの区分ではない。ユーザーの分類で言えば、同一人物がNew VisitorとReturning Visitorのどちらにも含まれることがある。

だから図7の例で言えば、New VisitorとReturning Visitorの各値の203と12の合計である215が、全体のユーザー数206と合致しない訳だ(一方「セッション」指標は、単純合計の234が全体の数値にも合致しているのを確認して欲しい)。

それなのに、重複がある単純合計の215を分母としてそれぞれのシェアを出すのはおかしいのだ。強いてグラフで表現しろと言うなら、ユーザー数全体の206を分母にした棒グラフにすべきだ。つまり各項目の割合は、それぞれ203÷206(98.54%)、12÷206(5.83%)と表現すべきものだ。


<おかしな集計が生じる原因>

表面的な現象についてはここまでにして、いよいよここから何故こういう数字の違いが生じるのか、その原因と、それぞれがどういう集計をした結果出てきた数値なのか、そして我々はどの数字を使うべきなのかといった核心に迫っていきたい。

この続きをみるには

この続き:6,743文字/画像12枚

Google アナリティクスの「新規ユーザー」と「新規セッション率」の集計仕様

衣袋 宏美

2,480円

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

衣袋 宏美

読む

コメントを投稿するには、 ログイン または 会員登録 をする必要があります。