むおんせい@ITサービスマネージャ

運用系システムエンジニアをやってます。都内某SIer所属、地元は長野県 【経歴】プログ…

むおんせい@ITサービスマネージャ

運用系システムエンジニアをやってます。都内某SIer所属、地元は長野県 【経歴】プログラマ5年→システム運用7年目 【資格】jitec: FE,AP,SC,SM 【メインテーマ】「運用をやって気付いた『開発者に知って欲しいこと』」と運用者の日常をマイペースで書いていきます。

マガジン

最近の記事

運用日和 vol.09 実績のある手順の罠

運用業務に限らず、過去にうまくいった手順を利用することは多くあると思います。しかし、最近「その手順が必ずしもうまくいくとは限らない」というツラい経験をしたので、皆様にも共有したく記事にしました。 この記事を読んで、どうか一人でも私と同じ罠にハマってツラい思いをしないことを祈ります。 今回の画像は過去の実績をイメージしました。 ▼サーバ再構築をすることになった私が所属するチームで運営しているアプリケーションは本番環境に脆弱な箇所がないか、第三者機関から定期的な脆弱性診断を実

    • 運用日和 vol.08 素敵なサービスには素敵なサポートを

      今回のタイトルは「アルジャーノンに花束を」という昔ドラマでみた名前に寄せさせてもらいました。(特に意味があるわけではないんですけど。。) さて、今回は運用をやっている人間だからこそ感じてしまった、 素敵なサービスの残念な実体験をご紹介します。 ※今回は実在するサービス(運送会社)に対して、私の体験談を語るものです。しかし、どこかの企業を批判したいわけではなく、 運用者として反面教師にしたいという思いがただあるのみです。 ご理解いただいたうえで読み進めていただけると幸いです

      • 運用日和 vol.07 「ダメだこいつ早くなんとかしないと、、」を何で判断するか

        タイトルはデスノートとかで有名なセリフですが、今回のコイツはもちろんサーバのことです。 もっと詳細にお話すると、冗長構成(HA構成)の時のサーバ切り替え時に何を以て故障と判断し、切り替え処理を行うかという点のお話です。 今回なぜこの話を書こうと思ったかと言えば、先月(2020年10月)に起こった東証のシステムがバックアップに切り替わらずサービス停止したのをみて、思うところがあったからです。 ▼障害原因はメモリ故障同じサービスの運用者として東証の対応がどうだった、富士通がど

        • 運用日和 vol.06 リリース(展開)作業とニギリについて

          今回はサービスに対して変更を入れる場合は、 お客様との約束(ニギリ)がどうなっているかが重要という話です。 私が担当している業務はリリース展開業務で 開発Tからテスト完了済みのモジュールを受け取り、リリース判定という運用試験の結果と本番環境展開手順の判定会を実施し、 本番環境へ展開する作業を主に担当しています。 今回はその中で展開作業に関して得た気付きを共有します。 ※note内ではリリース作業ではなく展開作業という言葉を使います。  下記参考記事にもありますが、リリー

        運用日和 vol.09 実績のある手順の罠

        マガジン

        • 運用日和 vol.01-03
          3本

        記事

          noteの有料公開やめました。 私の文章はまだまだ勉強中だし、ファンがついているわけでもないので時期尚早ってやつだったなと思います。 なので「全文公開してるけど、募金したい人はしてもいいよ」ってスタンスにしました。まぁ、それくらいは許してください。。

          noteの有料公開やめました。 私の文章はまだまだ勉強中だし、ファンがついているわけでもないので時期尚早ってやつだったなと思います。 なので「全文公開してるけど、募金したい人はしてもいいよ」ってスタンスにしました。まぁ、それくらいは許してください。。

          note自動連携テストー

          運用日和 vol.05 脆弱性とレガシーシステム

          レガシーなシステムでも捨てられないんだよ。 だって使われてるんだからという話です。 ------------------------------------------------------------------ ここでいうレガシーは負の遺産的な意味で使っています。 車のレガシー好きの方々、気を悪くしたらすみません。 ------------------------------------------------------------------ 十数年前年に出た話

          運用日和 vol.05 脆弱性とレガシーシステム

          運用日和 vol.04 冗長構成とシステム監視 〜サービスを支える仕組み〜

          こんにちは、むおんせいです。 今の現場で運用のお仕事をさせていただき、早7年が経過しようとしています。 最近久々に同じチームに業界未経験の新人が入ってきて、運用について教えていたんですが 「これ文章に残しておいたら後々使えるんじゃないか」と思ったので、記録用に残します。 本日のテーマは冗長構成とシステム監視です。 今回は新人さんにもわかりやすくを心掛けながら書いてみます。 ▼外から見えるプログラムと「見えないプログラム」私の会社はシステムを作る会社なので、3ヶ月くらい

          運用日和 vol.04 冗長構成とシステム監視 〜サービスを支える仕組み〜

          リリース作業(正確には展開作業)って、基本サービス無停止でいけるようにするべきという話、職場で何回も出てるけど、 IPAシステムアーキテクトの試験の中にも似たようなことを問う記述があって日々の議論は間違いじゃなかったなーと思った件

          リリース作業(正確には展開作業)って、基本サービス無停止でいけるようにするべきという話、職場で何回も出てるけど、 IPAシステムアーキテクトの試験の中にも似たようなことを問う記述があって日々の議論は間違いじゃなかったなーと思った件

          運用日和 vol.03 ウソみたいだろ。死んでるだぜ(サーバとネットワークが)

          こんにちは、むおんせいです。 今回のタイトルは、昔なつかしのタッチより。 でも、達也と和也の話ではなく、サーバ故障とネットワーク断の話です。 (年齢がバレるネタだなぁ。。) ※注意※ ヘッダー画像の犬猫は死んでません、寝ているだけです。 紛らわしい書き方をして申し訳ない。。 ▼導入システム開発をやっていると、プログラムがコケた場合どう処理するかの例外処理を書くことがあります。 例えば、プログラムの内容から外部出力をする場合特定のディレクトリ配下に出力する設定になってい

          運用日和 vol.03 ウソみたいだろ。死んでるだぜ(サーバとネットワークが)

          【ご連絡】あと何個か記事を書いたら有料記事も書いていくつもりです。 理由は「個人でどれだけ価値をうみだせるか」に挑戦したいのです。 記事の値段やいつからはまだ検討中ですが、誰かの思いを裏切ってしまうかもしれないので、最初にご連絡しておきます ご理解お願いします。

          【ご連絡】あと何個か記事を書いたら有料記事も書いていくつもりです。 理由は「個人でどれだけ価値をうみだせるか」に挑戦したいのです。 記事の値段やいつからはまだ検討中ですが、誰かの思いを裏切ってしまうかもしれないので、最初にご連絡しておきます ご理解お願いします。

          今の現場のサービスは、今後プログラム自動生成ツールで作ることになるらしい。 そして、今後生き残れるのは 下記の技術者と言われた。 1. 設計ができる人 2. データ活用ができる人 私は『運用がわかる人』も生き残れるんじゃないかと思ってる。

          今の現場のサービスは、今後プログラム自動生成ツールで作ることになるらしい。 そして、今後生き残れるのは 下記の技術者と言われた。 1. 設計ができる人 2. データ活用ができる人 私は『運用がわかる人』も生き残れるんじゃないかと思ってる。

          運用日和 vol.02 ログとHDDとサービスの未来

          こんにちは、むおんせいです。 今回はプログラムエラー時などに書き出す「ログ」に着目してお話をしていきます。 読み終わった頃にはログの大切さを実感し、exceptionを握りつぶしたりしない体質になる、、はず。。  ▼何で書いたのかシステム運用の具体的な内容初回となりますが、テーマをログにした理由は、運用の仕事はとにかくログを確認することが多いなと感じたからです。 私が担当しているサービス運用では権限の都合で本番環境は運用者しかさわれません。 それゆえに、顧客からの問い合

          運用日和 vol.02 ログとHDDとサービスの未来

          note→twiteerの連携テスト2(再試験)

          note→twiteerの連携テスト2(再試験)

          note→twiteerの連携テスト

          最近担当するようになったサービスのリリース展開作業、1基盤あたりの当日作業時間が11H超えるとかダメですね。。トラブルあったら12H超えちゃいます。 今回の対応終わったら、運用し易いシステム構成にしてもらうべく、「意見を纏めておこう」と心に誓いながら朝の電車にゆられます。

          最近担当するようになったサービスのリリース展開作業、1基盤あたりの当日作業時間が11H超えるとかダメですね。。トラブルあったら12H超えちゃいます。 今回の対応終わったら、運用し易いシステム構成にしてもらうべく、「意見を纏めておこう」と心に誓いながら朝の電車にゆられます。