安定したサービスには、信頼性の高いインフラ、リスクを想定した準備、障害時に素早い復旧ができる態勢が必要です。近年、これらの領域を包括的に担う役割はSite Reliability Engineering (SRE)と呼ばれ、従来にない概念が提唱されるようになりました。そうしたSREの考え方を、Cygamesのインフラチームでは、手作業の削減、サービスリスクの測定、ノウハウの蓄積の3つの観点から取り入れようとしています。本セッションではSRE導入がもたらしたチームの変革を事例とともに紹介します。
本セッション枠は、株式会社Cygames様より提供させていただきます。
杉本 潤 [Cygames]
株式会社Cygames
インフラエンジニア
2017年4月にCygamesへ新卒入社。インフラチームに合流し、基盤ソフトウェアのインストール・管理やオンコール対応などを担当する。2018年以降はサーバー構築のコード化を担当し、多数の大規模プロジェクトを支えるインフラを効率的かつ高品質に届けることを目指している。