ミスiDプレエントリーにおける投票行動の一考察-その1

そしてはじめまして、ファンシー浅沼です。
僕は音楽やアイドル文化、芸術が好きな世の中的にはおっさん世代の人間で、特に好きなのが黒宮れいちゃん、最近ではZOCも推してます。
そんな二組に共通するのがミスiDというオーディション。れいちゃんはミスiD2015、ZOCにもミスiD受賞者が何人かいます。そんな輝かしい受賞者を輩出しているミスiDが今年も始まりました。

このオーディションは4月から始まる本エントリーでの書類選考を経て、カメラテスト→セミファイナル→ファイナルと続いていきます。
それとは別に、本エントリーの書類選考を免除できるプレエントリーというルートがあり、これはCHEERZというアプリの中の一つのイベントとして開催され、ちょうどこの前の日曜日にイベントが終了しています。

このnoteではそのイベント「ミスiD2020プレエントリー」で行われたファンによる投票=チアについて、不正の疑惑が見受けられましたので、実際の数値などをもとにその疑惑について個人としての見解を述べたいと思います。

先に結論をいうと、疑惑は疑惑のままで不正をした事実をつきとめてはおりません。ただし、今後どのような調査を行えば真偽が判明するかについては提示したいと思います。

また先にお断りをしておきますが、このあとの解説でアーティストの名前が出てきますが、ここで名前のあがるアーティストやそのファンの皆さま、またCHEERZやミスiDを運営する企業さま、審査の先生方を批判するものではありません。あくまで、不正を行った何者かがいる可能性があり、批判されうるのはその何者か(個人または団体)との立ち位置でおります。

入手した2つの数値

現在は削除済みのためアカウント名は伏せますが、この方からデータを所有している方をご紹介いただき、2つのデータを借用させていただきました。
ひとつは「★お気に入りに登録」の数値、もうひとつは「CHEER!」の数値です。この2つのデータをもとに、それぞれ疑惑の解説を行います。

★お気に入りに登録 の疑惑について

まず、こちらのグラフをご覧ください。

縦軸がアーティストに対する「お気に入り」の数で、横軸が日付となります。日付の範囲はプレエントリーが始まった3/18から終了した3/24の翌日まで。データは1時間ごとに取得しているため、1アーティストにつき1日に24の数値をならべたものとなります。このグラフでは最終的に上位10名となったアーティストのみを抜粋して表示しています。

このグラフについて特徴的なことや違和感を感じることはありませんか?
私はこれを見て不自然で作為的なグラフだなと感じました。このへんの感覚は普段から数値などのデータを見ていたり、実際にCHEERZでアーティストの応援をしていないと実感しずらいものかもしれませんが、私は強烈な違和感を感じました。
違和感はなくとも特徴的だと誰もが感じる一本の曲線、【黄色の曲線】。この後のお話はそれについてのお話になります。

ツイッターで ”ミスiD 不正” のようなツイートを見た方もいらっしゃるかと思いますが、この黄色の曲線のアーティストは「ハムスターの息子に産まれて良かった」というひと。ひとなのかハムスターなのかわからないけど、多分ひと。

黄色の曲線が低い位置から極端に上昇してTOPになり、そのままTOPを継続して完了する。まるでシンデレラストーリーのようなこの曲線の違和感について、どのようにするとこのシンデレラ曲線が作られるかをいくつかのSTEPにわけて解説したいと思います。

お気に入りDAY1~DAY2

「ハムスターの息子に産まれて良かった」さんのお気に入り数の最初の2日です。グラフには点線で対象データの傾向線をガイドとしていれています。

「ハムスタ〜」さんは「ハ息子」と呼ばれているようなので、このあとはそのように呼びます。また、このあとのグラフにも点線があれば傾向線となります。

右肩上がりにお気に入りの数が増えていて当事者であれば非常に喜ばしい状況ですが、これが本当にファンの一人一人がお気に入りに登録した数だと思いますか?

ファンにそんな問いかけをすると、「そうに決まっている」「フォロワー数多いのになめんな」「数学的に評価しろ」とかなんとか言って、なかなか耳を傾けてもらえない現状があり何度か言い合いをしましたが、今思うとそういった方々はそれはそれでいいんじゃないかと思います。自分が見たいように、自分が好きなように現実を解釈すればよいと思います。

それはさておき、僕は真実を知りたいし、どのようなロジックで、どんな実装をしてこの数値を叩き出したかの答えを知りたかったので、ローデータをいじくりまわして隠された答えをさがしていました。そこでたどり着いたことがあります。

このグラフを解く鍵はひとつ

期間をフェーズわけするとある特徴が見えてきました。
DAY1(3/18)とDAY2(3/19)を別々に見てみましょう。

まずはDAY1

約1,000人のエントリーの中から最終的に上位10人となるトップアーティストたちをしりめにダントツの勢いでお気に入り数を伸ばす黄色の曲線「ハ息子」

曲線と書きましたが、すごく直線的。それがヒントでした。

補助線を入れていますが、お気に入りの数が毎時約26づつ増加します。
昼夜問はず、毎時です。
「ハ息子のファンは昼夜問わず、チアをしているんだ!」
はい、声を荒げるのはいいですが、本当に均等に稼働していましたか?
このグラフを実現するのは難しい。
「あなたは、1日目の05:00台にお気に入りに登録してね」仮にできたとしても、そんなことまでして実施することではないですよね。何もメリットがないうえに、そもそもこのグラフは定時でデータを収集してグラフにプロットしないと出てこない。

はい、DAY2にいきます。3/19です。

同様に最終TOP10アーティストでのハ息子の位置

そして、その特徴です。
DAY1~DAY2を一緒にして見ていたらわからなかったですが、単日にすると見えてきたのが、今度は毎時約10づつ増加しています。

以上、お気に入りをフェーズわけして見てきたわけですが、勘が鋭い人はあるおかしなことに気が付いたはずです。

DAY1とDAY2の間には

空と君とのあいだには♪ みたいな歌が浮かんできて、そう僕は自分のことをおじさんと認めないおじさん世代だった。

これまでに確認した2つの考察
 DAY1は毎時26づつお気に入りが増える
 DAY2は毎時10づつお気に入りが増える

そして、このあいだに隠されていること
それは、日をまたぐとルールが変わる ということ

DAY1は26づつね、DAY2は10づつね、よろしく!
シンデレラストーリーなだけあって、24時に何かあるんですかね??

DAY3~DAY4

日付をまたいだら、またルールが変わりました。
次は、毎時1~2づつに変更。DAY3~DAY4のあいだはギアチェンジなし。

最初のグラフにもどります

今度はアーティストの名前入りです。傾向線も入れています。
気になる人は拡大して見ましょう。

これまでDAY1、DAY2、DAY3~DAY4とフェーズわけして確認してきましたが、そのことを頭にいれると同じグラフでも見え方が変わってきますよね?

DAY1は 26お気に入り/h
DAY2は 10お気に入り/h
DAY3とDAY4は 1~2お気に入り/h

そのあとのDAY5とDAY6は自然増かな。

ちょっと別の観点から見ると

日ごとのお気に入り数です。
黄色のDAY1~DAY2の飛び抜け感と、そのあとの撃沈感に違和感ありすぎ。
こんなのジャニーズと飲酒が見つかって活動休止!みたいなスキャンダルがないと、ここまで撃沈しないですよね。うん(泣き

第一部まとめ

というわけで、ハ息子をとりまくミスiD2020プレエントリーにおいて
なんだか人知では計り知れない黒い疑惑があるなーって見えてきました。

いや、人でもできないことはないけど約1000人と連携して、君はDAY2の17時台にハ息子をお気に入りしてねとかいう会話があったら、まじでその界隈やべえなって思う。

第二部は、お待ちかねのチア数の不正疑惑についてだけど
長くなったので、また今度!

ロジック同じだから、システム的に考えられる人にはちょっと教えてあげる
変数が「お気に入り数」から「チア数」になって
値が1日ごとにかわるという今回と同じパターンだから
説明しないでも大丈夫でしょ?

それでは