この記事は、ニフティグループ Advent Calendar 2024 21日目の記事です。
もうすぐクリスマスですね。みなさんはプレゼントをもらえるなら何が欲しいですか?
私は最近寝ているときに乾燥で喉がやられるので強靭な喉が欲しいです。
SREチームの島です。
普段はサービスの信頼性向上のため障害数の削減やSRE推進をメインに活動しています。
私事ですがニフティに転職して来年の3月で丸2年になります。
今回は私がニフティでこの2年間でやってきたことや成長したと思うことを振り返ってみようと思います。
私の経歴について
はじめに私の経歴について紹介します。 前職ではずっとプログラマーやチームリーダーとしてソフトウェアエンジニアリングに従事していました。そして2社目となるニフティでSREのポジションに就きました。
1社目(2009〜2023)
- 主にSES、SI事業に従事し、お客様先に常駐したり、自社のプロジェクトチームでソフトウェアエンジニアリングに携わっていた
- 入社〜8年ほどは開発工程をメインに、それ以降はプロジェクトリーダーとしてプロジェクト管理を経験
- 技術としてはJava、PHP、C#、TypeScript、MySQLなどなど。フロントエンド、バックエンド開発がメイン
- インフラやクラウド環境の構築経験はなし(クラウド環境での開発経験はあり)
2社目(2023〜現職)
- ニフティにSREとしてジョイン
ニフティでやったこと
SREとして
下記のSRE本のプラクティスに沿って私が主にやってきたことをあげていきます。
Monitoring
SLI/SLO、アラート、ダッシュボードの作成
@nifty天気予報のリニューアルプロジェクトにEmbedded SREとして参画しました。その際にAmazon CloudWatch Application Signalsを使ったSLI/SLOの計装、アラート設定、CloudWatch Dashboardの構築を行いました。モニタリングをSREが責任を持って担当することで開発者が開発に専念できたと思っています。
FourKeysの計装
FourKeysを計装し、社内のDevOpsチームへ導入を行いました。 社外カンファレンスで登壇もさせていただきました。
こちらはその後全社的な取り組みへと発展し、現在はシステム・プロダクトごとの運用コストの可視化・最適化を行うプロジェクトに参画しています。
Postmortem / Root Cause Analytics
ポストモーテムの実施支援
ポストモーテムの実施が滞っているチームに声をかけ、私がファシリテーションしながら一緒にポストモーテムの実施や再発防止アクションの促進を進めています。
Testing + Release producers
継続的デリバリの実装
こちらも@nifty天気予報のリニューアルプロジェクトに参画したときの話で、ecspressoを使ったECSへのCDを実装しました。
Development
IaCによるインフラ構築
いくつかのプロジェクトでIaC(Terraform)によるAWS環境の構築を経験しました。最初はコードでインフラ構築ができることに感動したことを覚えています。
その他
弊社にはチームを横断した活動を行うワーキンググループ(WG)という活動があり、私は下記の2チームに参画しています。
システム安定化WG
障害の検知、復旧までにかかる時間を短くする・障害数を減らすことを目的としたWGです。
このWGの取り組みとしては下記のようなことを行いました。
- 障害発生時のエスカレーションフローの見直し
- 障害報告書テンプレートの改善
- ポストモーテムの実施支援
採用ブランディングWG
ニフティのエンジニアリングカルチャーを知ってもらうためにエンジニアが主体となってテックやカルチャーの発信、ブランディング活動を行うWGです。
個人的な活動も含め、ブランディング活動としては下記のようなことに携わりました。
- 昨年開催した弊社テックイベント「NIFTY Tech Day 2023」の運営スタッフ
- 開発チームへのインタビューの実施・記事の作成
- 社外カンファレンスに登壇
- 弊社のテックトークイベント「NIFTY Tech Talk」に2回登壇
やってよかったこと
ワーキンググループに入ったことで横断活動がしやすくなった
弊SREチームは社内のチームを横断した活動を多く行なっています。ただ、中途入社の身としては全く関係性のないチームに横からズカズカ入っていって「おい、SREしているか」と言いに行くのは抵抗感がありました。 しかし上に挙げたWGの活動を通して徐々に存在を認知してもらえるようになり、私自身も知っている人が増えてきたことで横断活動への抵抗感も薄れていきました。 そういった意味でもWGで活動したことはとても大きかったと思います。
社外のカンファレンスに参加するようになった
実はニフティに入って初めてエンジニアによる勉強会やカンファレンスが開催されていることを知りました。それまでは業務以外でエンジニアと関わることはなく、非常にもったいないことをしていたなと思います。
社外のカンファレンスに参加するようになって視野を広く持てるようになったと思います。例えば「こういう課題がある、どう解決したらいいんだろう。そういえばこの前のカンファレンスで他社のSREが同じような事例を紹介していたな」という感じで課題解決のヒントを探せるようになりました。
入社当初、分からないことだらけで絶望していた自分にとって社外カンファレンスは大きな支えになっていました。
成長したと思うこと
未経験の技術を習得した
前職とは技術スタックが全く違っていたので未経験の技術を多く学ぶことができました。学ぶだけでなく実務で使えたので身についていきました。実務で初めて使った技術、ツールだけでも以下のようなものがあります。
- AWS
- Lambda
- CloudWatch
- StepFunctions
- EventBridge
- S3
- IAM
- GCP
- BigQuery
- Cloud Run
- GitHub
- GitHub Actions
- ecspresso
- Terraform
- Python
- Grafana
- Tableau
- Looker Studio
- Notion
SREingできるようになった
まだまだできないこともありますが入社時と比べると多くのSREingができるようになりました。当時はSLIもSLOも机上の知識だけで、いざ設定、運用しろと言われてもできませんでした。今では目標値の設定から計算式の決定、計装まで実践できるようになりました。
ポストモーテムも入社前に学習はしていましたが実際に書いたことはありませんでした。ある日、障害が発生した際にポストモーテムをおこなう機会がありました。そのときの経験から、開発を進めながら障害対応を行う大変さを知りました。自身がDevOpsを経験することで開発者の思いを知ることができました。
IaCによるインフラ構築も、以前はインフラエンジニアが構築してくれた環境を使って開発をするだけでした。今ではすべてではないですがIaCを使って自分でインフラを構築できるようになりました。
まとめ
普段は「自分、成長しているな〜」と思うことはあまりないですが、改めて振り返ってみると色々できることが増えているなと感じることができました。その反面、まだまだプロダクトに貢献できていない、信頼性を向上できているのだろうかと悩むこともありますが年末くらいは今年やってきたことを自分で褒めたい思います。
みなさんも今年の振り返りをして自分を讃えてみてはいかがでしょうか。
明日は、@ryugakさんです!
それではMerry Christmas