noteのアクセス状況どうなってるの?
noteを投稿していると、どのぐらい読まれているのか気になりますよね。
noteは無料アカウントでもダッシュボードから簡単なアクセス状況を確認することができます。
このアクセス状況について、最近気になることがあります。
同じ記事が複数表示される問題
同じタイトルが複数表示されることがあるのです。
こんな感じで。
表示されている記事の数は合っているので、重複している数だけアクセス状況が表示されていない記事があります。
なにが起きているのでしょうか?
同じ記事が複数表示される原因を推測する
エンジニアをかじっているので、不思議な挙動を見ると原因を考えたくなります。どうしてこの現象が起きているのか推測してみました。
なによりもまずは自分の環境を疑いましょう。特定のブラウザのみで発生する現象であれば、キャッシュをクリアすれば解消するかもしれません。
結論としては、ブラウザを変えてもスマートフォンアプリで閲覧しても、同じ現象が確認できました。どうも環境の問題ではないようです。
・・・
noteのアクセス状況はリアルタイムに更新されるのではなく、一定のサイクルで更新される仕組みです。
最終集計時刻は一日1回更新されますが、当日投稿した記事の数字が表示されることもあり、実際は一日に数回更新されているようです。
更新回数について検証された記事によると、一日4~6回ぐらいだそうです。
頻度はさておき、記事ごとのビュー・コメント・スキの数を集計して、それを集計日別に保存していると想像します。
古いタイプのエンジニアなので、ついRDB脳で考えてしまいますが、実際はキーバリュー型データベースが使用されているのではないかと思います。
期間を切り替えることができるので、リアルタイムで集計していると推測します。試しにタイトルを変更すると、即座に反映されました。
noteの求人情報に技術スタックが書いてありました。
処理が超高速なのでRedisでしょうか?
※NoSQLは専門外なので憶測です
ソートする項目によって重複が異なる問題
もうひとつ気になる挙動があります。
コメント数でソートすると、重複が一気に増えるのです。
スプレッドシートに書き出してソートしてみると、最大4件も重複している記事が幾つもありました。
ビュー・コメント・スキで重複している記事が異なることから、それぞれ個別に集計して、表示を出し分けている説が考えられます。
コメント数が同じであることが関係しているようにも見えますが、理屈はよく分かっていません。
謎のままにしておいたほうがいいこともある
なんとなくNoSQLデータベースまわりに原因があるような気がするというところまでは想像できましたが、私の技量ではここまでが限界です。
同じような現象に困っている人がいないかと検索してみましたが、それらしい情報を見つけることはできませんでした。
同様の現象が出ている方がいらっしゃいましたら教えてください。
いずれにしても、アクセス状況にはちょっとした揺らぎがあるようなので、ほどほどに参考にしたほうが良さそうです。
では。
・・・
この記事が気に入ったらサポートをしてみませんか?