見出し画像

世間はどれくらいストレージを使っているか?

今日は辻村です。世の中はクラウドの記事が多いですが、すぐにいろんなところに構築したシステムが全部クラウド上に移るわけでもありません。今この瞬間も、インフラエンジニアと言われる方々やサポートの方々の戦いは続きます。今回の記事は「世間はどれくらいストレージを使っているのか?」というお話です。「これくらいでの使用率で使いたい」と言う理想と現実に触れてみます。

1. どれくらいの使用率で使いたいか?

ディスク装置をはじめとするストレージを利用する場合、容量が足らなくなっては困ります。データベースインスタンスをテストのためにもう1つ立ち上げたいとか言ったときに「機械の調達が必要だから2週間ほど待ってくれ」では困るわけです。ストレージの管理者は「どうすれば安定稼働できるか?どうすればいざというときに対応できるか?」を考えながら管理しています。

幸いなことに私のツイッターのアカウントの方にはインフラを構築したり管理している方が多そうなので、アンケートを採ってみました。設問として「性能などを加味して理想としては」なんて言葉を入れるべきだったと反省していますが、以下が、その結果です。管理されている方やシステムの設計をされる皆様の願望としては、「40%〜60%」くらいで管理したいと言うことですね。

2. 実際の使用量

ところで実際の使用量はどうなのでしょうか?

あるところから過去1年半くらいのストレージについてのデータをいただきました。現在の勤務先で収集しているデータをお出しできると良いのですが、データを抽象化してお出ししても無敵の法務部が走ってきそうなのでそちらは差し控えます。(本当は色々良くしてくださる心強いバックオフィスの皆様です。)

なお、以下のデータは n=10 位のデータの一般的な傾向です。手元にあるデータは1週間毎の複数システムの平均値のデータであって、最頻値や最大値の情報はありません。したがって、ばらつきがあるのかどうかわかりません。

2.1 用語の整理

(1) 導入されている物理容量

実際に導入されている物理容量は、システムの更新があったりするので、安定して右肩上がりというわけではありません。一方で、ストレージ装置に組み込まれるHDDやSSDは一つ一つの容量が世代交代で大きく変わることがあるので部品の交換がすすむと突然容量が大きくなることがあります。

(2) 実効容量

これとは別にストレージの種類によっては、自動的に圧縮されたり、同じ内容をもう一度書き込まない重複排除の機能があったりするので、見かけの保管容量が物理的に保管できる容量より大きくなります。これを実効容量と呼ぶことにします。例えば印刷用の画像をシアン・マゼンタ・イエロー・ブラック (CMYK)のそれぞれの色に分けたデータなどは、圧縮されて10分の1以下になることもあります。同じ圧縮率のデータでストレージを使った場合、実効容量は物理容量の10倍になります。

(3) 使用量

使用量は単純に保管された結果。物理容量がどれだけ消費されているかという値です。

(4) 使用率

この記事では使用率は、使用量÷物理容量をパーセントで表します。

2.2 いただいたデータからの傾向

いただいたデータから求めた物理容量と使用率を1か月単位でまとめたのが以下のグラフです。

オレンジの棒が物理容量、青い線が使用率です。2019年5月はまだ2週分しかデータがそろっていないので、信頼に値しません。このグラフから、使用率はおよそ40%くらいで推移しているのがおわかり頂けるかと思います。もっとも各システムは機材の入れ替えのために、ディスクを増設したり撤去したりしています。データを移動するにあたって、一時的に物理容量が増えたりします。したがって、物理容量が急に増え使用率が一定に見えても、必ずしも保管されるべきデータが急に増加しているとは限らないところは注意が必要です。

いかがでしょう、この値、皆様の思っていた値とどれくらい違うでしょうか?

この記事はここまでです。 最後まで読んでいただいてありがとうございます。 気に入っていただいたなら、スキを押していただいたり、 共有していただけるとうれしいです。 コメントや感想大歓迎です!