見出し画像

絵でわかるGoogle Cloud 『実践 SRE』 #gc_appmodern #湊川あいグラレコ

こんばんは! IT漫画家の湊川あい(みなとがわ・あい)です。

Google Cloud Japan さんのオンライン放送「App Modernization OnAir」前回に引き続き、第12回目に湊川あいがグラフィックレコーディングで参加。セッションの内容を、イラストでわかりやすくまとめました!

今回イラスト化したセッションはこちらです。

【タイトル】
『実践 SRE』 #gc_appmodern

【スピーカー】
手塚 卓也 さま:株式会社スリーシェイク Sreake 事業部 部長

SREロードマップ

GoogleCloudさんグラレコ_013

現場のあるある問題:
SREチームを作ったはいいものの……
現実問題「SREなんでしょ? これもやっといて」と言われてしまい、様々なタスクを押しつけられるハメに!?

GoogleCloudさんグラレコ_013 cut1

▼改善策:チームの役割を明確に!
・Googleの提唱するカタチにとらわれず、今の組織やチームに合わせてアレンジすることが大切
・さらに、他チームと密に連携し「協働」することで、SREチームが取り組んでいることの理解を得る

GoogleCloudさんグラレコ_013 cut2

SLI、SLO、SLAって何? 図解で整理!

GoogleCloudさんグラレコ_014

SRE の仕事は「データドリブン」です。
具体的な数値データを元にして、施策を打っていくわけですね。

そのためには、まずはメトリクスやログなどのデータをとにかく集めていくのが大切です。

そして、それらのデータの中から、目的に合致した SLI、SLO、SLA を設定します。

SLI、SLO、SLA の違いは、イラストにまとめたとおりです。

「そもそも何の項目を指標として計測するのか?」が SLI。
SLI として設定されるのは、たとえば レスポンスの速さや、エラーの数です(どんな項目をSLIとするかは、サービスや組織、目的によって異なります)。

そして、その中の「内的な目標値」が SLO。「対外的な保証値」が SLAです。
対外的というのは、社外の顧客に対して「この数値以上 or 以下は、保証できますよ」と言える値のことです。

「そもそも SRE とは何か」 を学びたい方に

手塚さんによると「そもそも SRE とは何か」を学びたい方には、こちらのコンテンツがおすすめとのことです。

SRE本(Web上で閲覧可能・英語)
https://sre.google/sre-book/table-of-contents/
https://sre.google/workbook/table-of-contents/

SRE をわかりやすく理解出来るコンテンツ
・Google Cloud Days SRE の基本と組織への導入 〜 サービスレベル目標やエラー予算などサービスの信頼性に対する考え方〜

・3-shake SRE Tech Talk #2 (Google Cloud 篠原様による登壇)

手塚さんイチオシの資料、ぜひ参考にしてみてくださいね。

動画配信を見逃した方は、アーカイブをこちらからご覧いただけます!

次回予告

次回の App Modernization OnAir は
2021 年 7 月 21 日 (水) 18:00 - 19:00 です。

テーマは 『GKE ネットワーキング 最新機能 Deep-dive』

オンライン放送の視聴は、もちろん無料!
全国どこからでも、どなたでもご覧いただけます。
事前にこちらの公式ページからGoogleアカウントで登録することで、放送前に配信URLがお知らせされますよ。

それでは、次回の配信をお楽しみに〜!


▼今までの『絵でわかる Google Cloud』シリーズの note はこちらにまとめています!


サポートいただけると制作速度が上がります!!