楽天ペイは多くのユーザーに利用される決済サービスであり、システム障害発生時には迅速かつ的確な対応が求められます。
なので、事前に障害対応チームを組織し、フローや仕組みを構築するとが肝要です。
本セッションでは、楽天ペイの障害対応チームの立ち上げからを振り返ります。その後、障害発生時の対応フローを実例を挙げながら説明します。
また実際にフローを回してきて得た知見や、システムの信頼性向上に向けた取り組み、障害対応でこれから取り組んでいこうとする課題や改善についてもお話しします。
- 楽天ペイの障害対応の歴史
- 楽天ペイの障害対応のプロセスと実践
- 楽天ペイの障害対応のこれから
横田 健太[楽天ペイメント]
楽天ペイメント株式会社
楽天ペイシステム部 / Assistant Manager
楽天ペイメント株式会社 楽天ペイシステム部に所属し、Assistant Managerとして楽天ペイのシステム運用を担当。楽天ペイにおける決済を中心とした全領域の安定稼働を支える役割を担い、特に障害対応に注力している。マイクロサービス化によって複雑化した分散システム上で発生する障害に対応し、国内外のメンバーと共に複数の大規模障害対応をインシデントコマンダーとしてリード。迅速な復旧と再発防止策の策定を通じて、サービスの信頼性向上に貢献している。技術的な知見に加え、チーム間の連携やプロジェクトマネジメントにも強みを持つ。好きなNew RelicのNQRL句は`COMPARE WITH 1 week ago`
・LinkedIn
齊藤 雅幸[New Relic]
New Relic株式会社
技術統括 コンサルティング部 ソリューションコンサルタント