Datadog NTP 監視でアラート鳴りまくり対応
概要
サーバ時刻の監視を Datadog で実施する際、標準時刻の参照先が異なることで
不要なアラートが発生する事象がありました。
Datadog はデフォルトで pool.ntp.org
を参照しています。
AWS EC2 に設定した Chrony ではデフォルトで ntp.nict.jp
を参照する様にしていた為、ある日突然アラートがなりまくる事象がありました。
この対策として、
Datadog と Chrony の参照先を統一して管理する様に設定しました。
タイムサーバホストを統一する
今回は、AWS を利用しており、 AWS にも NTP サーバがある為、そちらを参照することとしました。
AWS Time Sync Service のホストは 169.254.169.123
です。
169.254.169.123
のリンクローカル IP アドレスを介してアクセス可能な為、プライベートサブネットからでもアクセス可能です。
ip アドレスという辺りがある日変更されたとかあると辛いので怖いですが、今の所、そういうことはないです。
- /etc/datadog-agent/conf.d/ntp.d/conf.yaml
1 | init_config: |
- /etc/chrony/chrony.conf
1 | # server ntp.nict.jp minpoll 4 maxpoll 4 # コメントアウト |
上記設定後、リスタート
1 | $ sudo systemctl restart chrony |
上記によりアラート解消されました。
参照
Datadog NTP 監視でアラート鳴りまくり対応
https://kenzo0107.github.io/2018/07/29/2018-07-30-datadog_ntp_alert/