見出し画像

zabbixでちょっと間違えた使い方をしてみる。

サーバーの死活状況や各種リソース状況(CPU使用率、メモリ消費量、ストレージ残量など)をまとめて監視することができる、統合監視ツールのzabbixを、ちょっと間違えた使い方(?)をしてみた。
(有料記事ですが無料で最後まで読めます)

zabbixとは

オープンソースの統合監視ツールで、予め登録されているサーバーやネットワーク機器の状態を定期的に取得し、一覧表示することができ、決められた条件にあてはまるデータを取得すると、警報を表示できる上に、それに智大なったメール送信等の動作(アクション)を実行することができる。

実際に使っている例

実際に動作している画面はこんな感じ。

これはウチで管理しているストリーミングサーバーを監視しているもので、データ転送量、CPU負荷、ストレージ残量を表示している。上の方に「障害」の赤文字とともに警報が表示されているのがわかる(これは試験的に表示させているものなので、実際に障害が出ているわけではないので、念のため)。

これは監視対象のサーバにzabbix-agentというアプリをインストールしておくことで、zabbix-server(上の画面を表示させるサーバーアプリ)との通信を行い、各種数値を返してくる。これらのデータはあとから時間を遡って表示することもできるので、障害解消後に検証のために確認することができるようになる。

また、zabbix-agentの昨日に含まれていない数値を取得したい場合にも、Userparameterや外部チェックという機能を使うことで、多くの情報を取り出すことができる、例えば、

これはあるコミュニティ放送が実施しているインターネット配信の同時接続数の推移を表示している。SHOUTcastDNASはユーザー数を始めとしたサーバーステータスをXML、またはJSONで返す機能があるため、それを利用して実装している。

もちろん、同時接続数以外にも、例えばストリーミングサーバーの停止やエンコーダーからのストリーム消失、webサイトの動作異常なども検出可能だ。

ちょっと使い方を間違えてみる

ここで使い方をちょっと間違えてみる。
基本的に「値が取れるものは何でも監視できる」のがzabbixのいいところなので、こんなことをやってみた。

これは東京都や国土交通省のサイトから各河川の水位を取得してグラフにしている。2023年6月当初の大雨による河川増水を受けて、「いちおう」地元のメディアを自負する足立区民放送としては、一刻も早く情報を発信していきたく、一元監視したうえで各種水位(避難判断水位、氾濫危険水位)を超える、または超えたことを監視する必要があった。と言ってもこの監視を始めたのは「令和元年房総半島台風」の際に試験的に実装し、その後ブラッシュアップを重ねてきた経緯がある。

そしてzabbixは外部ツールとの連携もできる。たとばこんなの。

これはzabbixのアクションに、ツイッターを更新するスクリプトを指定しておき、その際に河川名や基準水位、現在の水位をツイートさせるというもの。この動作は
zabbixが河川の水位を取得→その取得が基準水位を超えていると判断→警報(トリガー)を表示→トリガーに定められている動作(アクション)を実行
という流れで実現している。ちなみに足立くみは足立区民放送のオリジナルキャラで、普段は天気予報や、たまに飯テロを呟いている

一般的なアクションでは「メールの送信」を行うのが普通で、これを利用することで、障害発生時に特定のメンバーにメールを送信して障害発生を通知することができる。

こんなふうに「数値を取って異常があれば発報」ができるzabbixは、サーバー管理だけではなくいろんな目的に利用ができる。

そして毎度のことながら、Office Stray Catではzabbix導入のお手伝いができるので、ぜひご相談を!

ここから先は

0字

¥ 100

この記事が気に入ったらサポートをしてみませんか?