Más contenido relacionado
cloudpack監視項目一覧表(サンプル)
- 2. 閾値 閾値
# 項⽬ コマンド NRPE 通報 備考 Nagios 通知内容
Warning Critical
5分に1回ロードアベレージのチェックを⾏う
5分前に5% 10分前に4% 15分前に3%の閾値を超えた場合 Waning
ロードアベレー ◯ ◯ となる CRITICAL - load average
1 check_load 5,4,3 10,6,4
ジ 5分前に10% 10分前に6% 15分前に4%の閾値を超えた場合 Critical WARNING - load average
となる
5分に1回ルートディスク使⽤量のチェックを⾏う
DISK WARNING - free space: /
2 ルートディスクcheck_disk ◯ 0.2 0.1 ◯ ルートディスク使⽤量70%を超えた場合 Warningメール送信
ルートディスク使⽤量80%を超えた場合 Criticalメール送信 DISK CRITICAL free space:/
5分に1回データディスク使⽤量のチェックを⾏う
DISK WARNING - free space: /mnt/hdd1
3 データディスクcheck_disk ◯ 0.2 0.1 ◯ データディスク使⽤量70%を超えた場合 Warningメール送信
データディスク使⽤量80%を超えた場合 Criticalメール送信 DISK CRITICAL - free space: /mnt/hdd1
USERS WARNING - 5 users currently
5分に1回ログインユーザ数チェックを⾏う
ログインユー ◯ logged in
4 check_users 5 10 ◯ 5ユーザ以上ログインしていた場合 Warningメール送信
ザー数 USERS WARNING - 10 users currently
10ユーザ以上ログインしていた場合 Criticalメール送信
logged in
5分に1回全プロセス数チェックを⾏う
PROCS WARNING: 301 processes
5 全プロセス数 check_procs ◯ 300 350 ◯ プロセス数300以上起動していた場合 Warningメール送信
プロセス数350以上起動していた場合 Criticalメール送信 PROCS CRITICAL: 350 processes
6 SSH check_ssh ◯ 5分に1回SSH起動チェックを⾏う CRITICAL - Socket timeout after 10
sshが起動していない場合 Criticalメール送信 seconds
5分に1回死活チェックを⾏う
250ms 300ms ◯ 返り値が250msもしくは50%かけた場合 Warningメール送信 PING WARNING - Packet loss = 50%
7 死活監視 check_ping
50% 90% 返り値が300msもしくは90%かけた場合 Criticalメール送信 PING CRITICAL - Packet loss = 100%
2分に1回 /var/log/messageログをチェック
messagesログ ◯ ◯ アラートキーワード「kernel」が1回書きこまれたらWarningメール送 CRITICAL kernel
8 check_log2
監視 信 CRITICAL Error
「Error」も
5分にメモリチェックを⾏う
check_memor CRITICAL - memory free
9 メモリ監視 ◯ 80 90 ◯ メモリ80%使⽤していた場合 Warningメール送信
y メモリ90%使⽤していた場合 Criticalメール送信 WARNING - memory free
PROCS WARNING: 0 process with args
5分にcronのチェックを⾏う 'crond'
10 crond プロセス ◯ ◯ crond プロセスが確認できない場合 Criticalメール送信 PROCS CRITICAL: 0process with args
'crond'
1
- 3. URL
# HOST/ドメイン コマンド NRPE 通報 URL 備考 Nagios 通知内容 備考
5分に1回http//の監視を⾏う 返り値が200の場合はOK
1 check_http ◯ HTTP CRITICAL
返り値が200以外の場合 Criticalメール送信
5分に1回http//の監視を⾏う 返り値が200の場合はOK
2 check_http ◯ HTTP CRITICAL
返り値が200以外の場合 Criticalメール送信
5分に1回http//の監視を⾏う 返り値が200の場合はOK
3 check_http ◯ HTTP CRITICAL
返り値が200以外の場合 Criticalメール送信
5分に1回http//の監視を⾏う 返り値が200の場合はOK
4 check_http ◯ HTTP CRITICAL
返り値が200以外の場合 Criticalメール送信
2
- 4. DB
閾値 閾値 Nagios 通知内容
# 項⽬ コマンド NRPE 通報 備考
Warning Critical
5分に1回httpd起動確認を⾏う
1 Apache check_http ◯ HTTP CRITICAL
httpdが起動していない場合 Criticalメール送信
5分に1回httpdプロセスチェックを⾏う
Apacheのプロ PROCS WARNINGL: 230 processes
2 check_procs ◯ 230 250 ◯ httpd プロセス230個起動していた場合 Warningメール送信
セス数 PROCS CRITICAL: 250 processes
httpd プロセス250個起動していた場合 Criticalメール送信
5分に1回 ポート8009監視を⾏う
3 Tomcat check_tcp ◯ 接続を拒否されました
ポート8009が解放されていない場合はWarningメール送信
5分に1回javaプロセスを監視を⾏う
キーワード 「/usr/bin/java」 PROCS CRITICAL: 0 processes
4 Java プロセス ◯ ◯ の⽂字列で監視 with args /usr/bin/java
上記プロセスが確認できない場合はCriticalメール送信
3
- 5. URL
閾値 閾値 Nagios 通知内容 備考
# 項⽬ コマンド NRPE 通報 備考
Warning Critical
1 MySQL check_mysql ◯ ◯ 5分に1回 MySQL監視を⾏う CRITICAL - no connection
MySQLが起動していない場合 Criticalメール送信
5分に1回PostgreSQL起動確認を⾏う
2 PostgreSQL check_pgsql ◯ ◯ CRITICAL - no connection
PostgreSQLが起動していない場合 Criticalメール送信
4