亿华智慧云亿华智慧云

Nagios:一款开源的电脑系统和网络监控工具(下)

Nagios:一款开源的电脑系统和网络监控工具(下)
复制define contact{          name                            generic-contact    ; 联系人名称          service_notification_period     24x7               ; 当服务出现异常时,款开控工发送通知的电脑时间段,这个时间段"24x7"在timeperiods.cfg文件中定义          host_notification_period        24x7               ; 当主机出现异常时,系统发送通知的和网时间段,这个时间段"24x7"在timeperiods.cfg文件中定义          service_notification_options    w,络监u,c,r            ; 这个定义的是“通知可以被发出的情况”。w即warn,具下表示警告状态,款开控工u即unknown,电脑表示不明状态;                                                             ; c即criticle,系统表示紧急状态,和网r即recover,络监表示恢复状态;                                                             ; 也就是具下在服务出现警告状态、未知状态、款开控工紧急状态和重新恢复状态时都发送通知给使用者。电脑          host_notification_options       d,系统u,r                   ; 定义主机在什么状态下需要发送通知给使用者,d即down,表示宕机状态;                                                                  ; u即unreachable,表示不可到达状态,r即recovery,表示重新恢复状态。          service_notification_commands   notify-service-by-email ; 服务故障时,发送通知的方式,可以是邮件和短信,这里发送的方式是邮件;                                                                  ; 其中“notify-service-by-email”在commands.cfg文件中定义。亿华云          host_notification_commands      notify-host-by-email    ; 主机故障时,发送通知的方式,可以是邮件和短信,这里发送的方式是邮件;                                                                  ; 其中“notify-host-by-email”在commands.cfg文件中定义。           register                        0                    ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL CONTACT, JUST A TEMPLATE!          }  define host{          name                            generic-host    ; 主机名称,这里的主机名,并不是直接对应到真正机器的主机名;                                                          ; 乃是对应到在主机配置文件里所设定的主机名。          notifications_enabled           1               ; Host notifications are enabled          event_handler_enabled           1               ; Host event handler is enabled          flap_detection_enabled          1               ; Flap detection is enabled          failure_prediction_enabled      1               ; Failure prediction is enabled          process_perf_data               1               ; 其值可以为0或1,其作用为是否启用Nagios的数据输出功能;                                                          ; 如果将此项赋值为1,那么Nagios就会将收集的数据写入某个文件中,以备提取。          retain_status_information       1               ; Retain status information across program restarts          retain_nonstatus_information    1               ; Retain non-status information across program restarts          notification_period             24x7            ; 指定“发送通知”的时间段,也就是可以在什么时候发送通知给使用者。          register                        0               ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE!          }  define host{          name                            linux-server    ; 主机名称          use                             generic-host    ; use表示引用,也就是将主机generic-host的所有属性引用到linux-server中来;                                                          ; 在nagios配置中,很多情况下会用到引用。          check_period                    24x7            ; 这里的WordPress模板check_period告诉nagios检查主机的时间段          check_interval                  5               ; nagios对主机的检查时间间隔,这里是5分钟。          retry_interval                  1               ; 重试检查时间间隔,单位是分钟。          max_check_attempts              10              ; nagios对主机的最大检查次数,也就是nagios在检查发现某主机异常时,并不马上判断为异常状况;                                                          ; 而是多试几次,因为有可能只是一时网络太拥挤,或是一些其他原因,让主机受到了一点影响;                                                          ; 这里的10就是最多试10次的意思。          check_command                   check-host-alive ; 指定检查主机状态的命令,其中“check-host-alive”在commands.cfg文件中定义。          notification_period             24x7            ; 主机故障时,发送通知的时间范围,其中“workhours”在timeperiods.cfg中进行了定义;                                                          ; 下面会陆续讲到。          notification_interval           10              ; 在主机出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。站群服务器单位是分钟;                                                          ; 如果你觉得,所有的事件只需要一次通知就够了,可以把这里的选项设为0          notification_options            d,u,r           ; 定义主机在什么状态下可以发送通知给使用者,d即down,表示宕机状态;                                                          ; u即unreachable,表示不可到达状态;                                                          ; r即recovery,表示重新恢复状态。          contact_groups                  ts              ; 指定联系人组,这个“admins”在contacts.cfg文件中定义。          register                        0               ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE!          }  define host{          name                    windows-server  ; The name of this host template          use                     generic-host    ; Inherit default values from the generic-host template          check_period            24x7            ; By default, Windows servers are monitored round the clock          check_interval          5               ; Actively check the server every 5 minutes          retry_interval          1               ; Schedule host check retries at 1 minute intervals          max_check_attempts      10              ; Check each server 10 times (max)          check_command           check-host-alive        ; Default command to check if servers are "alive"          notification_period     24x7            ; Send notification out at any time - day or night          notification_interval   10              ; Resend notifications every 30 minutes          notification_options    d,r             ; Only send notifications for specific host states          contact_groups          ts              ; Notifications get sent to the admins by default          hostgroups              windows-servers ; Host groups that Windows servers should be a member of          register                0               ; DONT REGISTER THIS - ITS JUST A TEMPLATE          }  define service{          name                            generic-service         ; 定义一个服务名称          active_checks_enabled           1                       ; Active service checks are enabled          passive_checks_enabled          1                       ; Passive service checks are enabled/accepted          parallelize_check               1                       ; Active service checks should be parallelized;                                                                  ; (disabling this can lead to major performance problems)          obsess_over_service             1                       ; We should obsess over this service (if necessary)          check_freshness                 0                       ; Default is to NOT check service freshness          notifications_enabled           1                       ; Service notifications are enabled          event_handler_enabled           1                       ; Service event handler is enabled          flap_detection_enabled          1                       ; Flap detection is enabled          failure_prediction_enabled      1                       ; Failure prediction is enabled          process_perf_data               1                       ; Process performance data          retain_status_information       1                       ; Retain status information across program restarts          retain_nonstatus_information    1                       ; Retain non-status information across program restarts          is_volatile                     0                       ; The service is not volatile          check_period                    24x7             ; 这里的check_period告诉nagios检查服务的时间段。          max_check_attempts              3                ; nagios对服务的最大检查次数。          normal_check_interval           5                ; 此选项是用来设置服务检查时间间隔,也就是说,nagios这一次检查和下一次检查之间所隔的时间;                                                           ; 这里是5分钟。          retry_check_interval            2                ; 重试检查时间间隔,单位是分钟。          contact_groups                  ts           ; 指定联系人组          notification_options            w,u,c,r          ; 这个定义的是“通知可以被发出的情况”。w即warn,表示警告状态;                                                           ; u即unknown,表示不明状态;                                                           ; c即criticle,表示紧急状态,r即recover,表示恢复状态;                                                           ; 也就是在服务出现警告状态、未知状态、紧急状态和重新恢复后都发送通知给使用者。          notification_interval           10               ; Re-notify about service problems every hour          notification_period             24x7             ; 指定“发送通知”的时间段,也就是可以在什么时候发送通知给使用者。          register                        0                ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE!          }  define service{          name                            local-service           ; The name of this service template          use                             generic-service         ; Inherit default values from the generic-service definition          max_check_attempts              4             ; Re-check the service up to 4 times in order to determine its final (hard) state          normal_check_interval           5             ; Check the service every 5 minutes under normal conditions          retry_check_interval            1             ; Re-check the service every minute until a hard state can be determined          register                        0             ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE!          }  1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.48.49.50.51.52.53.54.55.56.57.58.59.60.61.62.63.64.65.66.67.68.69.70.71.72.73.74.75.76.77.78.79.80.81.82.83.84.85.86.87.88.89.90.91.92.93.94.95.96.97.98.99.100.101.102.103.
赞(1)
未经允许不得转载:>亿华智慧云 » Nagios:一款开源的电脑系统和网络监控工具(下)