18.3 顾问门槛

阈值是顾问的预定义​​限制。如果监控值超出定义的阈值,则会生成一个事件并显示在资产的“事件”页面上。

Advisor 阈值使用各种不同的值类型,具体取决于受监控的值。有些使用百分比,例如最大连接数的百分比。其他人使用定时持续时间,例如平均语句执行时间。还可以检查特定配置元素是否存在或是否正确。

可以为大多数顾问定义以下按严重性顺序列出的阈值:

  • 注意:不影响服务器性能的问题,但可用于指示较小的配置问题。

  • 警告:不影响服务器性能的问题,但可能表明存在问题并需要调查。

  • Critical:表示正在影响或可能很快影响服务器性能的严重问题。此类问题需要立即引起注意。

  • Emergency:表示服务器出现严重问题。服务器不可用或无响应,需要立即引起注意。

笔记

并非所有顾问都需要阈值参数,其他顾问没有任何参数,例如图形 顾问。

下图显示了顾问的“参数”选项卡上的阈值定义示例:

图 18.6 阈值定义示例

顾问阈值定义示例。

显示的值取自 Availability Advisor、 Maximum Connection Limit Nearing 或 Reached。这些值定义记录事件的最大连接百分比。例如:

  • 如果连接总数是定义的最大值的 75-84%,则“事件”页面中会显示通知事件。

  • 如果连接总数是定义的最大值的 85-94%,则“事件”页面中会显示警告事件。

  • 如果连接总数是定义的最大值的 95-99%,则“事件”页面中会显示严重事件。

  • 如果连接总数是定义的最大值的 100% 或更多,则“事件”页面中会显示紧急事件。

基于时间的阈值

The majority of the time-based thresholds use simple duration values, such as seconds, minutes and so on. These are used to monitor such values as system uptime and, if the value for uptime drops below a certain value, indicating a restart, trigger an event.

Others use an Exponential Moving Average Window, which monitors values over a predefined time period. One such advisor is the CPU Utilization Advisor. The moving average window is used because CPU utilization can spike many times a minute, for a variety of different reasons. Raising an event for each spike would not be useful. The moving average enables you to monitor CPUs for long durations and take an average CPU utilization across that duration. Thresholds are defined against that average.

Percentage-based Thresholds

基于百分比的阈值根据服务器定义值的百分比触发事件。例如,最大连接数会根据与受监视实例或组的连接总数的百分比值引发事件。

基于文本的阈值

基于文本的阈值用于检查特定配置值是否正确定义,或检索系统进程(如备份)的成功或失败消息。