メディアのURLキリ番調べ。
僕がよく見ているサイト、ビジネスインサイダーって記事のURLが末尾6桁の数字なんですね。
https://www.businessinsider.jp/post-186967
↑この記事のURLが上記のものです。
それをみて、キリ番ってどんな記事なんだろう…って思ったので調べてみました。キリ番から記事をみるっていうのも面白いのではないか…??っていう興味本位です。
まずは最近の記事から数字のあたりをつける。
https://www.businessinsider.jp/post-196648
https://www.businessinsider.jp/post-196784
https://www.businessinsider.jp/post-195931
https://www.businessinsider.jp/post-195503
https://www.businessinsider.jp/post-196328
みた感じ、毎日複数の投稿がなされているので投稿日時は関係ない模様。
6桁のうち上2桁は19、下4桁は3桁目はそこまでぶれずに5,6あたりではありながらもランダムっぽい。(もしくは下書きから割り当てられるために公開時ではわからない順になっているのかもしれない。)
とりあえず、195と196あたりで下3桁のキリ番を考えることにしました。
下3桁のキリ番でみてみる
196の下3桁調べ
https://www.businessinsider.jp/post-196700
記事がないということを知らせてくれる404が返ってきました。
https://www.businessinsider.jp/post-196000
記念すべき000のキリ番はこの記事でした。
195の下3桁調べ
https://www.businessinsider.jp/post-195000
404が返ってきました。
最近の記事で表示された数字の付近で探ってみることにします。
https://www.businessinsider.jp/post-195500
404が返ってきました。
https://www.businessinsider.jp/post-195930
こちらも404。
https://www.businessinsider.jp/post-195980
1959●0は8にだけ記事がありました。
6桁以外のキリ番でみてみる
6桁以外はどうなんだろう…ということでみてみることに。
1桁 = 1記事もなし。
https://www.businessinsider.jp/post-1
404が返ってきました。1つ目の投稿が消されているのか、ランダムなのか。もしくは1桁台はないのか。
残りの1桁全てを見ましたが、全部ありませんでした。1桁台はもともとないのかもしれません…
2桁 = 5/9記事存在。
https://www.businessinsider.jp/post-90
ありました。2017年のトランプさん関連の記事です。
https://www.businessinsider.jp/post-40
2016.10.15の記事。キリ番の中では一番古い記事でした。
https://www.businessinsider.jp/post-60
2017.5.18の記事。
https://www.businessinsider.jp/post-70
https://www.businessinsider.jp/post-80
(ちなみに…)一番小さい数字の記事は37だった。
https://www.businessinsider.jp/post-37
2016.9.14の記事。
BUSINESS INSIDER JAPAN はBUSINESS INSIDER の日本版として2017年1月に立ち上がりました。翻訳記事に加えて、日本独自のニュースも報道していきます。ご期待下さい!
Aboutページ曰く2017.1から日本版が開始しているので開始前から流し込まれてる記事だったりがあるというのがわかりますね。
手でやるのはけっこうきついので3桁以降の記事はあるものとして考えます。ここからはキリ番がランダムな可能性があるため、プログラミングの力を借りようと思います。
クローリングして答え合わせ
めんどくさくなったのでPythonのクローラーを使って数字を全て充てて、記事があればURLを、なければNullを返すコードを使うことにしました。
-----
ここから先はまた今度にします!
サポートしていただいたお金は旅の資金にさせていただければと思います。新しい刺激をもらいにいろんなところを旅したいです。