こんにちは。ニフティ株式会社の仲上です。
今回は、先日開催された SRE NEXT 2025 での発表内容と補足情報についてご紹介します!
イベント概要
先日、SRE NEXT 2025 が開催されました。
当社はゴールドスポンサーとして参加し、スポンサーブースの出展などを行いました。
当社が力を入れている分野については、技術広報もさることながらコミュニティとの繋がりも重視しているのでイベントの協賛を行っています。
SREもその分野の1つで、「SRE NEXT」のような大きなイベントには、2022年から毎年協賛しています。
ブースの詳細については担当者が別記事を作成していますので、こちらをご覧ください!
登壇内容について
本イベントでは10分間の登壇枠をいただき、私のチームが実施した監視基盤リプレイスについて発表しました。
初めての外部イベント登壇だったため緊張しましたが、非常に貴重な経験となりました。
発表資料はSpeakerDeckに公開していますので、興味のある方はぜひご覧ください。
発表内容の補足
発表時間が限られていたため内容を圧縮せざるを得ず、いくつか説明が不足していた部分がありました。この場を借りて補足説明をさせていただきます。
Grafana/Prometheusのコスト評価について
発表時の比較表では、Grafana + Prometheus の構成をコスト面で「高い」と評価しました。

この評価は、純粋なインフラコストだけでなく、運用工数も含めた総合的なコスト計算に基づいています。
Grafana + Prometheus はオープンソースツールであり、サーバーにインストールするだけで利用できますが、実運用では設定や基盤の運用・メンテナンスに予想以上の工数がかかるため、総合的なコスト面で「△」評価としました。
今回は時間の制約から、すでに利用経験のあるOSS版のみを検証対象としましたが、クラウドサービス版では結果が異なる可能性もあります。
もし同様の比較検証をされている方がいらっしゃれば、ぜひ情報共有いただけると幸いです。
具体的なコスト試算結果
今回は以下の条件でコスト試算を実施しました。
- 監視対象: サーバー20台
- ログイベント: 800万イベント/月
- ログ保持期間: 30日間
- ログデータ量: 1イベントあたり1KBと仮定し、月間 8GB のログデータ(800万イベント × 1KB/イベント ≈ 8GB)
- 為替レート: $1 = 158円
- リージョン: AWSは東京、Azureは東日本リージョン、Datadogは日本
試算結果は以下の通りです。
サービス | メトリクス | ログ | 合計(月額) |
---|---|---|---|
Datadog | ¥72,680 | ¥2,150 | ¥74,830 |
Amazon CloudWatch | ¥6,600(詳細メトリクス有効時) | ¥1,000 | ¥7,600 |
Azure Monitor | ¥0(メトリクスはログ料金に含む) | ¥6,300 | ¥6,300 |
Azure Monitor については、DCR(データ収集ルール)の設定により保存料金が変動しますが、おおよそAWSと同程度のコスト感になると予想されます。
クラウドネイティブな監視ツールはコスト面で明らかな優位性がありますが、機能性や使いやすさ、既存環境との親和性なども含めた総合的な判断が重要です。
Ask the speaker について
Ask the speaker では、監視設定周りの管理が課題になっていたという話題で盛り上がりました。実際、監視周りはGUIでつけるとルールが煩雑になって管理が大変なのでコードで管理したほうが良いですが、コードで管理すると作成コストが重くのしかかってきます。
今回の発表で紹介したコードのエクスポート機能はコードの作成コストを大きく抑える事ができるので、みなさんもぜひ試してみてください!
また、オンプレミス環境や他クラウド環境への監視についても話題があがりました。現状はまだ監視できていませんが、環境のリプレイスが増えてきたら必要に応じて監視対象にする予定です!
まとめ
SRE NEXT 2025での発表を通じて、監視基盤リプレイスに関する経験や知見を多くの方と共有できたことを嬉しく思います。
今後も監視基盤の改善を継続し、このブログ記事が皆さんの参考になれば幸いです。
最後に、SRE NEXTを開催してくださった運営・関係者の皆様・ブースに来ていただいた皆さん、発表まで支えてくれた仲間たち、その他関係していただいた方に心より感謝申し上げます。
ありがとうございました!