このページは機械翻訳したものです。

警告の設定

メトリックがしきい値を超えると、Oracle Cloud Infrastructure Monitoringサービスを使用してアラームを生成できます。

最初に、モニタリングの概要を確認して、モニタリング・サービスの概念および機能を理解します。アラームの設定の詳細は、アラームの管理を参照してください。モニタリングとアラームの両方に対する高度な問合せの作成については、Monitoring Query Language (MQL)リファレンスを参照してください。

また、アラーム・ルールを使用するように適切なポリシーが設定されていることを確認します。スタート・ガイドを参照してください。

続行する前に、通知サービスや、これらのアラームを受信するユーザーを定義するトピックなどのアラーム宛先を作成しておく必要があります。

次の表に、スタック・モニタリングで使用されるメトリックのアラーム・ルールの作成に必要なメトリックの詳細を示します。

リソースの種類 メトリック・ネームスペース アラーム・ルール・リソース・グループ アラーム・ルール メトリック参照
ホスト
  • GPUホスト
oracle_appmgmt host
非コンテナ、コンテナおよびプラガブルなOracle Databases oracle_oci_database なし Oracle Database Oracle Database
Oracle Databaseシステム、ASM、クラスタおよびリスナー oracle_oci_database_cluster oracle_asm, oracle_cluster, oracle_db_node, oracle_lsnr Oracle Database Oracle Databaseクラスタ

Oracle WebLogic Domain

Oracle WebLogic Cluster

oracle_appmgmt

weblogic_cluster

Oracle Weblogic Server WebLogicメトリック
Oracle WebLogic Server oracle_appmgmt weblogic_j2eeserver Oracle Weblogic Server WebLogicメトリック
Oracle HTTP Server (OHS) oracle_appmgmt oracle_http_server Oracle HTTP Server Oracle HTTP Server (OHS)のメトリック
Oracle Identity Manager (OIM) oracle_appmgmt oracle_oim / oracle_oim_cluster Oracle Identity Manager (OIM) Oracle Identity Manager (OIM)
Oracle Access Manager (OAM) oracle_appmgmt oracle_oam / oracle_oam_cluster Oracle Access Manager (OAM) Oracle Access Manager (OAM)
Oracle JVMランタイム oracle_appmgmt oracle_jvm Oracle JVM Oracle JVMメトリック
Oracle E-Business Suite oracle_appmgmt ebs_instance Oracle E-Business Suite E-Business Suiteメトリック
EBSアプリケーション・リスナー oracle_appmgmt oracle_ebs_app_lsnr Oracle E-Business Suite E-Business Suiteメトリック
EBSコンカレント処理 oracle_appmgmt oracle_ebs_conc_mgmt_service コンカレント処理 E-Business Suiteメトリック
EBSコンカレント処理 - 特殊 oracle_appmgmt oracle_ebs_conc_mgmt_service_specialized 同時処理 E-Business Suiteメトリック
EBSコンカレント処理ノード oracle_appmgmt oracle_ebs_cp_node Oracle E-Business Suite E-Business Suiteメトリック
EBS Formsシステム oracle_appmgmt oracle_ebs_forms_system Oracle E-Business Suite E-Business Suiteメトリック
EBSワークフロー・エージェント・リスナー oracle_appmgmt oracle_ebs_wf_agent_lsnr Oracle E-Business Suite E-Business Suiteメトリック
EBSワークフロー・バックグラウンド・エンジン oracle_appmgmt oracle_ebs_wf_bkgd_engine Oracle E-Business Suite E-Business Suiteメトリック
EBSワークフロー・グループ oracle_appmgmt oracle_ebs_wf_group Oracle E-Business Suite E-Business Suiteメトリック
EBSワークフロー通知メーラー oracle_appmgmt oracle_ebs_wf_notification_mailer ワークフロー通知メーラー E-Business Suiteメトリック
Apache Tomcat oracle_appmgmt apache_tomcat Apache Tomcat Apache Tomcatのメトリック
Microsoft SQL Server oracle_appmgmt sql_server Microsoft SQL Server Microsoft SQL Serverのメトリック
PeopleSoftアプリケーション・サーバー・ドメイン oracle_appmgmt oracle_psft_appserv PeopleSoft PeopleSoftメトリック
PeopleSoft Process Schedulerドメイン oracle_appmgmt oracle_psft_prcs PeopleSoft PeopleSoftメトリック
PeopleSoftPIA oracle_appmgmt oracle_psft_pia PeopleSoft PeopleSoftメトリック
PeopleSoft検索エンジン

(OpenSearch/Elasticsearch)

oracle_appmgmt elastic_search, open_search PeopleSoft PeopleSoftメトリック
PeopleSoftプロセス・モニター oracle_appmgmt oracle_psft_prcm PeopleSoft PeopleSoftメトリック
Apache HTTP Server oracle_appmgmt apache_http_server Apache HTTP Server Apache HTTP Serverのメトリック
OUDディレクトリ・サーバー oracle_appmgmt oud_directory Oracle Unified Directory Oracle Unified Directoryメトリック
OUDプロキシ・サーバー oracle_appmgmt oud_proxy Oracle Unified Directory Oracle Unified Directoryメトリック
OUDレプリケーション・ゲートウェイ oracle_appmgmt oud_gateway Oracle Unified Directory Oracle Unified Directoryメトリック
GoldenGate oracle_appmgmt oracle_goldengate Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate ServiceManager oracle_appmgmt oracle_goldengate_service_manager Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate AdminServer oracle_appmgmt oracle_goldengate_admin_server Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGateパフォーマンス・メトリック・サーバー oracle_appmgmt oracle_goldengate_pm_server Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate Extract oracle_appmgmt oracle_goldengate_extract Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate Replicat oracle_appmgmt oracle_goldengate_replicat Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate DistributionServer oracle_appmgmt oracle_goldengate_distribution_server Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate分散パス oracle_appmgmt oracle_goldengate_distribution_path Oracle GoldenGate Oracle GoldenGateメトリック

GoldenGate受信サーバー

oracle_appmgmt oracle_goldengate_receiver_server Oracle GoldenGate Oracle GoldenGateメトリック
GoldenGate受信パス oracle_appmgmt oracle_goldengate_receiver_path Oracle GoldenGate Oracle GoldenGateメトリック
カスタム・リソース oracle_appmgmt custom_resource プロセスベースのカスタムリソースサンプルアラームルール プロセスベースのカスタム・リソース・メトリック
Oracle Service Bus oracle_appmgmt oracle_servicebus Oracle Service Bus(OSB) Oracle Service Bus(OSB)
Microsoft IIS oracle_appmgmt microsoft_iis Microsoft IIS Microsoft IISメトリック
Microsoft IIS Webサイト oracle_appmgmt microsoft_iis_website Microsoft IIS Microsoft IISメトリック
NGINX oracle_appmgmt nginx NGINX NGINXメトリック

一般的なアラーム・シナリオのベスト・プラクティス

  1. リソースを検出したのと同じコンパートメントにアラーム・ルールを作成します。
  2. リソースが停止したときにアラームを生成するアラーム・ルールを設定するには、適切なメトリック・ネームスペースおよびリソース・グループを指定し、次のメトリックおよびトリガー・ルールを使用します:

    メトリック名: MonitoringStatus

    トリガー・ルール:

    • 演算子: equal to

    • 値: 0

    • トリガー遅延分数: 1

  3. 個々のリソース・インスタンスに対してトリガーするアラーム・ルールを設定するには、メトリックの選択に加えて、リソースを一意に識別するメトリック・ディメンションも追加する必要があります。

    リソース・インスタンスを一意に識別するには:

    1. resourceNameおよびresourceTypeまたは
    2. resourceIdを使用できます。

      ほとんどのメトリックは、拡張アラームの設定に使用できる追加のディメンションを定義します。

  4. メトリック参照にあるメトリックの説明を常に参照し、評価期間(各メトリックが収集される頻度)を確認します。アラームを設定する場合は、アラームの「間隔」値と同じ値を指定してください。これは、アラーム作成ページの右上隅にある「拡張モードに切替え」を使用して実行できます。拡張モード・ページの「問合せコード・エディタ」セクションに拡張MQLを提供できます。

ホスト

サンプルアラームルール: ホストモニタリング

  • リソース・タイプ: ホスト
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: host
評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

ホスト・ダウン

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント内のホストに対するクリティカル・アラームが停止しているか、1分以上ステータスがレポートされていません。
3

高いCPU使用率

メトリック名: CpuUtilization

警告MQL:

CpuUtilization[3m]{type="Total"}.mean() > 80

クリティカルMQL:

CpuUtilization[3m]{type="Total"}.mean() > 90
> 80 > 90 過去3分間のCPU使用率が80%を超えていることをレポートする特定のコンパートメント内のホストの警告アラーム。

特定のコンパートメント内のホストに対するクリティカル・アラームで、過去3分間のCPU使用率が90%を超えていることがレポートされます。

3

高いメモリー使用率

メトリック名: MemoryUtilization

警告MQL:

MemoryUtilization[3m]{type="Logical"}.mean() > 80

クリティカルMQL:

MemoryUtilization[3m]{type="Logical"}.mean() > 90
> 80 > 90 過去3分間のメモリー使用率が80%を超えていることをレポートする、特定のコンパートメント内のホストに対する警告アラーム。

過去3分間のメモリー使用率が90%を超えていることをレポートする、特定のコンパートメント内のホストに対する警告アラーム。

3

ファイルシステム使用率

メトリック名: FilesystemUtilization

警告MQL:

FilesystemUtilization[3m].mean() > 80

クリティカルMQL:

FilesystemUtilization[3m].mean() > 90
> 80 > 90 80%を超えるメモリー使用率をレポートする特定のコンパートメント内の任意のホスト上のファイルシステムの警告アラーム。

90%を超えるメモリー使用率をレポートする特定のコンパートメント内の任意のホスト上のファイルシステムのクリティカル・アラーム。

ノート

選択したファイル・システムを監視する場合は、fileSystemNameディメンションをさらに指定し、特定のニーズにあわせてアラームをカスタマイズできます。たとえば、次のMQL FilesystemUtilization[1m]{fileSystemName = "/", osType = "Linux"}.mean() > 80は、特定のコンパートメント内のLinuxホスト上のすべてのルート・ファイルシステムにのみ適用されます。

GPUホスト

サンプルアラームルール: GPUホスト

1

ホスト停止

メトリック名: MonitoringStatus

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし

特定のコンパートメント内のホストで、停止中または1分を超えるステータスを報告していないことを示すクリティカル・アラーム。

1

GPU温度

メトリック名: GPUTemperature

警告MQL:

GPUTemperature[5m]{Type="GPU"}.mean() > 98

クリティカルMQL:

GPUTemperature[5m]{Type="GPU"}.mean() > 101
> 98 > 101

いずれかのGPUが低速温度を超えた場合の警告アラーム。

GPUがシャットダウン温度を超えた場合のクリティカルアラーム。

速度低下と停止の温度は、GPUモデルごとに異なる場合があります。検出されたGPUの正しい値は、Stack Monitoring GPUホームページで確認できます。

  1. 個々のGPUのホームページに移動
  2. 「構成」メニュー・オプションを選択します。
  3. 「リソース固有のプロパティ」セクションで、temperatureSlowdownおよびtemperatureShutdownエントリを検索します。
5

高いCPU使用率

メトリック名: CpuUtilization

警告:

CpuUtilization[5m]{type="Total"}.mean() > 80

クリティカル:

CpuUtilization[5m]{type="Total"}.mean() > 90
> 80 > 90

過去5分間のCPU使用率が80%を超えていることをレポートする特定のコンパートメント内のホストの警告アラーム。

特定のコンパートメント内のホストに対するクリティカル・アラームで、過去5分間のCPU使用率が90%を超えていることがレポートされます。

1

高いメモリー使用率

メトリック名: MemoryUtilization

警告:

MemoryUtilization[1m]{type="Logical"}.mean() > 80

クリティカル:

MemoryUtilization[1m]{type="Logical"}.mean() > 90
> 80 > 90

過去5分間のメモリー使用率が80%を超えていることをレポートする、特定のコンパートメント内のホストに対する警告アラーム。

過去5分間のメモリー使用率が90%を超えていることをレポートする、特定のコンパートメント内のホストに対する警告アラーム。

1

ファイルシステム使用率

メトリック名: FilesystemUtilization

警告:

FilesystemUtilization[1m].mean()>80

クリティカル:

FilesystemUtilization[1m].mean() > 90
> 80 > 90

80%を超えるメモリー使用率をレポートする特定のコンパートメント内の任意のホスト上のファイルシステムの警告アラーム。

90%を超えるメモリー使用率をレポートする特定のコンパートメント内の任意のホスト上のファイルシステムのクリティカル・アラーム。

ノート

選択したファイル・システムを監視する場合は、fileSystemNameディメンションをさらに指定し、特定のニーズにあわせてアラームをカスタマイズできます。たとえば、次のMQL FilesystemUtilization[1m]{fileSystemName = "/", osType = "Linux"}.mean() > 80は、特定のコンパートメント内のLinuxホスト上のすべてのルート・ファイルシステムにのみ適用されます。

Oracle Database

サンプル・アラーム・ルール: 非コンテナ・データベース

  • リソース・タイプ: 非コンテナDB

  • メトリック・ネームスペース: oracle_oci_database

  • リソース・グループ: 該当なし

評価期間(分) アラーム・ルール 警告 クリティカル DBM推奨値の使用? Description
30

ストレージ使用率

メトリック名: StorageUtilizationByTablespace

ディメンション: tablespaceContents = PERMANENT

または

警告MQL:

StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean()> 75

クリティカルMQL:

StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean() > 85
>75 >85 Y 過去30分間の使用率が75%または85%を超える永続表領域の警告およびクリティカル・アラーム・ルール条件。
24時間 InvalidObjects >150 >200 なし  
15 BlockingSessions >1 >10 Y 過去15分間にブロッキング・セッションの数が1または10より大きい場合にアラームをトリガーする警告およびクリティカル・アラーム・ルール条件。
15 UsableFRA <20 <10 なし 使用可能な高速リカバリ領域の割合が過去15分間に20%または10%未満の場合にアラームをトリガーする警告およびクリティカル・アラーム・ルール条件。
5 ProcessLimitUtilization >70 >80 Y プロセス使用率(%)が過去5分間に70%または80%を超えた場合にアラームをトリガーする警告およびクリティカル・アラーム・ルール条件。
5 SessionLimitUtilization >90 >97 なし  
5 CPUUtilization >80 >85 Y  
5 FRAUtilization >70 >75 Y  
5 StorageUtilization >75 >85 Y  
5

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし   非コンテナOracle Databaseレポートのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。

サンプルアラームルール: コンテナデータベース

  • リソース・タイプ: コンテナDB

  • メトリック・ネームスペース: oracle_oci_database

  • リソース・グループ: 該当なし

評価期間(分) アラーム・ルール 警告 クリティカル DBM推奨値の使用? Description
1

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし なし 非コンテナOracle Databaseレポートのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
30

メトリック: StorageUtilizationByTablespace

ディメンション: tablespaceContents = PERMANENT

または

警告MQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75

クリティカルMQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85

>75 >85 Y 過去30分間の使用率が85%または90%を超える永続表領域の警告およびクリティカル・アラーム・ルール条件。
5 ProcessLimitUtilization >70 >80 Y プロセス使用率(%)が過去5分間に90%または95%を超えた場合にアラームをトリガーする警告およびクリティカル・アラーム・ルール条件。
5 SessionLimitUtilization >90 >97 なし  
15 UsableFRA <20 <10 なし 使用可能な高速リカバリ領域の割合が過去15分間に20%または10%未満の場合にアラームをトリガーする警告およびクリティカル・アラーム・ルール条件。
5 CPUUtilization >80 >85 Y  
5 FRAUtilization >70 >75 Y  
5 StorageUtilization >75 >85 Y  

サンプル・アラーム・ルール: プラガブル・データベース

  • リソース・タイプ: プラガブルDB

  • メトリック・ネームスペース: oracle_oci_database

  • リソース・グループ: 該当なし

評価期間(分) アラーム・ルール 警告 クリティカル DBM推奨値の使用? Description
1

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし なし 非コンテナOracle Databaseレポートのクリティカル・アラームが停止しているか、1分以上ステータスを報告していません。
5 CPUUtilization >80 >85 Y  
5 StorageUtilization >75 >85 Y  
15 BlockingSessions >1 >10 Y 過去15分間にブロッキング・セッションの数が1または5より大きい場合にアラームをトリガーする警告およびクリティカル・アラーム・ルール条件。
24時間 InvalidObjects >150 >200 なし  
30

メトリック: StorageUtilizationByTablespace

ディメンション: tablespaceContents = PERMANENT

または

警告MQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75

クリティカルMQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85

>75 >85 Y 過去30分間の使用率が85%または90%を超える永続表領域の警告およびクリティカル・アラーム・ルール条件。

アラーム・ルールの例: ASM/ASMインスタンス

  • リソース・タイプ: ASM

  • メトリック・ネームスペース: oracle_oci_database_cluster

  • リソース・グループ: oracle_asm

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし 非コンテナOracle Databaseレポートのクリティカル・アラームが停止しているか、1分以上ステータスを報告していません。
30 DiskGroupUtilization >85 >95  
30 DiskUtilization >85 >95  
アラーム・ルールの例: ASMクラスタ
  • リソース・タイプ: クラスタ

  • メトリック・ネームスペース: oracle_oci_database_cluster

  • リソース・グループ: oracle_cluster

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし 非コンテナOracle Databaseレポートのクリティカル・アラームが停止しているか、1分以上ステータスを報告していません。

アラーム・ルールの例: リスナー

  • リソース・タイプ: リスナー

  • メトリック・ネームスペース: oracle_oci_database_cluster

  • リソース・グループ: oracle_lsnr

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし 非コンテナOracle Databaseレポートのクリティカル・アラームが停止しているか、1分以上ステータスを報告していません。
5 RefusedConnections >1 >5  

E-Business Suite

サンプル・アラーム・ルール: EBS

  • リソース・タイプ: Oracle E-Business Suite
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: ebs_instance
評価期間(分) アラーム・ルール 警告 クリティカル Description
15

実行時間別実行済プログラム(ミリ秒)

メトリック名: ExecutedProgramsByRunningTime

MQL:

ExecutedProgramsByRunningTime[15m].mean() > 4000

Tip1:

ProgramNameまたはProgramShortNameディメンション・フィルタを追加して、アラームを特定のアプリケーションにフィルタできます。

> 4000 > 40000 リクエストの実行時間
15

アプリケーション別完了済リクエスト(比率)

メトリック名: CompletedRequestsByApplication

ディメンション名: Category

ディメンション値: Error

MQL:

CompletedRequestsByApplication[15m]{Category = "Error"}.mean() > 0.001

Tip1:

ApplicationNameまたはディメンション・フィルタを追加して、アラームを特定のアプリケーションにフィルタできます。

MQL:

CompletedRequestsByApplication[15m]{Category = "Error", ApplicationName = "<YOUR APP NAME>"}.mean() > 0.001
> 0.001 > 0.0025

指定された収集間隔のすべてのリクエストと比較した、エラーありで完了したリクエストの比率。

これは、0.1%を超えるリクエストが失敗した場合、警告が表示されることを意味します。0.25%を超える場合、クリティカルになります

15

アクティブ・ユーザー・セッション

メトリック名: ActiveUserSessions

MQL:

ActiveUserSessions[15m].mean() > 200
> 200 > 250 アクティブ・ユーザー・セッション数

サンプル・アラーム・ルール: EBSアプリケーション・リスナー

リソース・タイプ: EBSアプリケーション・リスナー

メトリック・ネームスペース: oracle_appmgmt

リソース・グループ: oracle_ebs_app_lsnr

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

モニタリング・ステータス

メトリック名:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし 0 特定のコンパートメント・レポート内のEBSアプリケーション・リスナーのクリティカル・アラームが停止しているか、1分以上ステータスがレポートされていません。

サンプル・アラーム・ルール: EBSコンカレント処理

リソース・タイプ: EBS Concurrent Processing

メトリック・ネームスペース: oracle_appmgmt

リソース・グループ: oracle_ebs_conc_mgmt_service

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

モニタリング・ステータス

メトリック名: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし 0 可用性ステータスです。
15

同時リクエストのエラー率

メトリック名: CompletedConcurrentRequests

ディメンション名: State

ディメンション値: Errored

MQL:

CompletedConcurrentRequests[15m]{State = "Errored"}.mean() > 0.001
> 0.001 > 0.0025 エラーありで1時間ごとに完了したリクエストのレート。100を乗算すると、パーセントになります。
15

同時リクエストの警告率

メトリック名: CompletedConcurrentRequests

ディメンション名: State

ディメンション値: WithWarning

MQL:

CompletedConcurrentRequests[15m]{State = "WithWarning"}.mean() > 0.15
> 0.0015 > 0.003 警告ありで1時間ごとに完了したリクエストのレート。100を乗算すると、パーセントになります。
15

コンカレント要求が正常に完了しました(操作/評価期間)

メトリック名: CompletedConcurrentRequests

ディメンション名: State

ディメンション値: Succ

ずるい

MQL:

CompletedConcurrentRequests[15m]{State = "Successful"}.sum() > 2500
> 625 > 2500 評価期間(デフォルトでは15分)に正常に完了したリクエストのレート。
15

実行中の同時リクエスト

メトリック名: ConcurrentRequestsByStatus

ディメンション名: State

ディメンション値: 実行

取り込む

MQL:

ConcurrentRequestsByStatus[15m]{State = "Running"}.mean() > 100
> 2500 > 10000 ユーザー別実行中の要求の数。
15

コンカレント要求保留中- 通常

メトリック名: ConcurrentRequestsByStatus

ディメンション名: State

ディメンション値: PendingNormal

MQL:

ConcurrentRequestsByStatus[15m]{State = "PendingNormal"}.mean() > 100
> 2500 > 10000 ユーザー別の保留中リクエストの数。
15

保留中の同時リクエスト- スタンバイ

メトリック名: ConcurrentRequestsByStatus

ディメンション名: State

ディメンション値: PendingStandBy

MQL:

ConcurrentRequestsByStatus[15m]{State = "PendingStandBy"}.mean() > 100
> 100 > 500 保留スタンバイ・ステータスのリクエストの数。
15

コンカレント要求非アクティブ- マネージャなし

メトリック名: ConcurrentRequestsByStatus

ディメンション名: State

ディメンション値: InactiveNoManager

MQL:

ConcurrentRequestsByStatus[15m]{State = "InactiveNoManager"}.mean() > 100
> 100 > 500 非アクティブなマネージャ・ステータスの要求の数。
15

コンカレント要求非アクティブ- 保留中

メトリック名: ConcurrentRequestsByStatus

ディメンション名: State

ディメンション値: InactiveOnHold

MQL:

ConcurrentRequestsByStatus[15m]{State = "InactiveOnHold"}.mean() > 100
> 100 > 500 非アクティブな保留ステータスの要求の数。
5

長時間実行コンカレント要求

メトリック名: LongActiveConcurrentRequests

MQL:

LongActiveConcurrentRequests[5m].mean() > 43200000

Tip1:

Phaseディメンション・フィルタを追加することで、アラームをRunningまたはPendingリクエストにフィルタできます。

MQL:

LongActiveConcurrentRequests[5m]{Phase = "Running"}.mean() > 43200000

Tip2:

ProgramNameまたはProgramShortNameディメンション・フィルタを追加することで、特定のプログラムでさらにフィルタできます。

MQL:

LongActiveConcurrentRequests[1m]{Phase = "Running", ProgramShortName = "<PROGRAM SHORT NAME>"}.mean() > 43200000
> 43200000 > 86400000 保留中または実行中のリクエストの経過時間(ミリ秒)。トラッキングされるのは、上位10のリクエストのみです。この例では、12時間後に警告、24時間後にクリティカルを取得することをお薦めします。

EBSコンカレント処理 - 特殊

リソース・タイプ: EBSコンカレント処理- 専門

メトリック・ネームスペース: oracle_appmgmt

リソース・グループ: oracle_ebs_conc_mgmt_service_specialized

メトリック メトリック表示名 単位 内容 収集頻度 ディメンション リソース名
MonitoringStatus 可用性 ステータス

リソースのステータス。値は次のとおりです:

1 = 稼働中

0 = 下

すべてのマネージャが稼働している場合のみ、ステータスは稼働しています。1人のマネージャのみが停止している場合、全体的なステータスは停止しています。

1分 なし oracle_ebs_conc_mgmt_service_specialized
ConcurrentProcesingComponentStatus コンカレント・マネージャ・ステータス ステータス コンカレント・マネージャの可用性 1分 コンカレント・キュー名、説明、ホスト名 oracle_ebs_conc_mgmt_service_specialized
CapacityUtilizationOfConcurrentManagers コンカレント・マネージャの容量使用状況 パーセント 実行中の最大プロセスの割合。マネージャの最大プロセスが10で5が実行されている場合、容量使用率は50%です 1分 マネージャの名前 oracle_ebs_conc_mgmt_service_specialized
ManagerMaxProcesses コンカレント・マネージャの最大プロセス マネージャのキューに入れるプロセスの最大数。 1分 マネージャの名前 oracle_ebs_conc_mgmt_service_specialized
ManagerRunningProcesses コンカレント・マネージャの実行中プロセス マネージャのキューで実行中のプロセスの数 1分 マネージャの名前 oracle_ebs_conc_mgmt_service_specialized

サンプル・アラート・ルール: EBS Workflow Notification Mailer

リソース・タイプ: EBS Workflow Notification Mailer

メトリック・ネームスペース: oracle_appmgmt

リソース・グループ: oracle_ebs_wf_notification_mailer

評価期間(分) アラーム・ルール 警告 クリティカル 説明
1

モニタリング・ステータス

メトリック名: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし 0 EBSコンカレント処理のクリティカル・アラームは、1minを超えるステータスを停止または報告しない特定のコンパートメント・レポートに特化されています。
1

コンカレント・マネージャの容量使用状況

メトリック名: CapacityUtilizationOfConcurrentManagers

MQL:

CapacityUtilizationOfConcurrentManagers[1m].mean() < 100
< 50 < 100 使用可能なすべてのマネージャのキャパシティ稼働率。

Apache Tomcat

サンプルアラームルール: Apache Tomcat

リソース・タイプ: Apache Tomcat

メトリック・ネームスペース: oracle_appmgmt

リソース・グループ: apache_tomcat

評価期間(分) アラーム・ルール 警告 クリティカル Description
3

Apache Tomcat Down

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()
なし なし 特定のコンパートメント内のApache Tomcatのクリティカル・アラームが停止しているか、3分以上ステータスがレポートされていません。
5

高いCPU使用率

メトリック名: CPUUtilization

警告MQL:

CPUUtilization[5m].mean() > 80

クリティカルMQL:

CPUUtilization[5m].mean() > 90
>80 >90

特定のコンパートメント内のApache Tomcatの警告アラームで、過去5分間、80%を超えるCPU使用率がレポートされます。

特定のコンパートメント内のApache Tomcatのクリティカル・アラームで、過去5分間90%を超えるCPU使用率がレポートされます。

5

JVMヒープ・メモリー使用率が高い

メトリック名: JVMMemoryUtilization

警告MQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80

クリティカルMQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90
>80 >90

特定のコンパートメント内のApache Tomcatの警告アラームで、過去5分間のJVMヒープ・メモリー使用率の80%以上がレポートされます。

過去5分間の90%を超えるJVMヒープ・メモリー使用率をレポートする、特定のコンパートメント内のApache Tomcatの警告アラーム。

5

高Webリクエスト処理時間

メトリック名: WebRequestProcessingTime

警告MQL:

WebRequestProcessingTime[5m].mean() > 1000

クリティカルMQL:

WebRequestProcessingTime[5m].mean() > 1500
>1500 >3000

1500ミリ秒を超える特定のコンパートメント内のApache Tomcatの警告アラームは、過去5分間のWebリクエスト処理時間を平均します。

3000ミリ秒を超える特定のコンパートメント内のApache Tomcatの警告アラームは、過去5分間のWebリクエスト処理時間を平均します。

Microsoft SQL Server

アラーム・ルールの例: Microsoft SQL Server

リソース・タイプ: Microsoft SQL Server

メトリック・ネームスペース: oracle_appmgmt

リソース・グループ: sql_server

評価期間(分) アラーム・ルール 警告 クリティカル 内容
3

SQL Server可用性ステータス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()
なし なし 特定のコンパートメント・レポート内のSQL Serverのクリティカル・アラームが停止しているか、3分以上ステータスを報告していません。
10

SQL Server CPU使用率(%)

メトリック名: CPUUtilization

警告MQL:

CpuUtilization[10m].mean() > 80

クリティカルMQL:

CpuUtilization[10m].mean() > 95
>80 >95 過去10分間のCPU使用率が80%を超えていることをレポートする特定のコンパートメント内のSQL Serverの警告アラーム。

特定のコンパートメント内のSQL Serverのクリティカル・アラームで、過去10分間における90%を超えるCPU使用率がレポートされます。

15

SQL Serverデータベース使用率

メトリック名: StorageDatabaseUtilization

警告MQL:

StorageDatabaseUtilization[15m].mean() > 80

クリティカルMQL:

StorageDatabaseUtilization[15m].mean() > 95
>80 >95 過去15分間、80%を超えるデータベース使用率をレポートする特定のコンパートメント内のSQL Serverの警告アラーム。

過去15分間、90%を超えるデータベース使用率をレポートする特定のコンパートメント内のSQL Serverのクリティカル・アラーム。

PeopleSoft

PeopleSoftアプリケーション・サーバー

  • リソース・タイプ: PeopleSoft Application Server Domain
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: oracle_psft_appserv
評価期間(分) アラーム・ルール 警告 クリティカル 内容
5

保健

メトリック名: Health

警告MQL:

Health[1m]{HealthState = "Warning"}.mean() = 1

クリティカルMQL:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

アプリケーション・サーバー・ドメインの全体的な状態。

警告アラームは、状態'warning'が1に等しい場合に起動されます。

クリティカル・アラームは、状態'critical'が1の場合に起動されます。

5

ロード

メトリック名: Load

警告MQL:

Load[1m]{LoadState = "Medium"}.mean() = 1

クリティカルMQL

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

アプリケーション・サーバー・ドメインの全体的なロード。

状態'medium'が1の場合、警告アラームが起動されます。

状態'heavy'が1の場合、クリティカル・アラームが起動されます。

5

平均サービス・リクエスト実行時間

メトリック名: AverageServiceRequestExecutionTime

警告MQL:

AverageServiceRequestExecutionTime[5m].mean()> 1000
> 1000 なし

サービス・リクエストの実行にかかった平均時間(ミリ秒)。

警告アラームは、平均でリクエストの実行に1秒以上(1000ミリ秒)かかる場合に起動されます。

5

アプリケーション・サーバーのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: ApplicationServer

クリティカルMQL:

QueuedTuxedoProcesses[5m]{Category = "ApplicationServer"}.mean() > 1
なし > 1 アプリケーション・サーバーで現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

BRKハンドラのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: BRKHandler

クリティカルMQL:

QueuedTuxedoProcesses[5m]{Category = "BRKHandler"}.mean() > 1
なし > 1 BRKハンドラの現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

BRKディスパッチャのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: BRKDispatcher

クリティカルMQL:

QueuedTuxedoProcesses[5m]{Category = "BRKDispatcher"}.mean() > 1
なし > 1 BRKディスパッチャに対して現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

PUBディスパッチャのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: PUBDispatcher

MQL:

QueuedTuxedoProcesses[5m]{Category = "PUBDispatcher"}.mean() > 1
なし > 1 PUBディスパッチャに対して現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

PUBハンドラのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: PUBHandler

クリティカルMQL:

QueuedTuxedoProcesses[5m]{Category = "PUBHandler"}.mean() > 1
なし > 1 PUBハンドラの現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

SUBディスパッチャのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: SUBDispatcher

クリティカルMQL:

QueuedTuxedoProcesses[5m]{Category = "SUBDispatcher"}.mean() > 1
なし > 1 SUBディスパッチャに対して現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

SUBハンドラのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: Category

ディメンション値: SUBHandler

クリティカルMQL:

QueuedTuxedoProcesses[5m]{Category = "SUBHandler"}.mean() > 1
なし > 1 SUBハンドラの現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

失敗したサーバー・プロセス

メトリック名: FailedServerProcesses

クリティカルMQL:

FailedServerProcesses[5m].mean() > 0
なし > 0 ドメイン内で失敗した、または停止しているサーバー・プロセスの数。サーバー・プロセスに障害が発生すると、クリティカル・アラームが起動されます。
15

状態ファイル

メトリック名: PeopleToolsStateFiles

警告MQL:

PeopleToolsStateFiles[15m].mean() > 0
> 0 なし ドメイン・ログ・ディレクトリに生成されたPeopleTools状態ファイルの数。いずれかの状態ファイルが生成された場合、警告アラームが起動されます。

PeopleSoft Process Scheduler

  • リソース タイプ: PeopleSoft Process Schedulerドメイン
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: oracle_psft_prcs
評価期間(分) アラーム・ルール 警告 クリティカル Description
5

保健

メトリック名: Health

警告MQL:

Health[1m]{HealthState = "Warning"}.mean() = 1

クリティカルMQL:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

プロセス・スケジューラ・ドメインの全体的なヘルス。

警告アラームは、状態'warning'が1に等しい場合に起動されます。

クリティカル・アラームは、状態'critical'が1の場合に起動されます。

5

ロード

メトリック名: Load

警告MQL:

Load[1m]{LoadState = "Medium"}.mean() = 1

クリティカルMQL:

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

プロセス・スケジューラ・ドメインの全負荷。

状態'medium'が1の場合、警告アラームが起動されます。

状態'heavy'が1の場合、クリティカル・アラームが起動されます。

5

PSPRCSRVのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: ProcessType

ディメンション値: PSPRCSRV

クリティカルMQL:

QueuedTuxedoProcesses[5m]{ProcessType = "PSPRCSRV"}.mean() > 1
なし > 1 プロセス スケジューラ(PSPRCSRV)に対して現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

PSDSTSRVのキューに入れられたプロセス

メトリック名: QueuedTuxedoProcesses

ディメンション名: ProcessType

ディメンション値: PSDSTSRV

クリティカルMQL:

QueuedTuxedoProcesses[5m]{ProcessType = "PSDSTSRV"}.mean() > 1
なし > 1 分散サーバー(PSDSTSRV)に対して現在キューに入っているプロセスの数。キュー内のプロセスが1つ以上あると、クリティカル・アラームが起動します。
5

失敗したプロセス

メトリック名: FailedProcesses

クリティカルMQL:

FailedProcesses[5m].mean() > 1
なし > 0 ドメイン内で失敗した、または停止しているサーバー・プロセスの数。サーバー・プロセスに障害が発生すると、クリティカル・アラームが起動されます。

PeopleSoftPIA

  • リソース・タイプ: PeopleSoft PIA
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: oracle_psft_pia
評価期間(分) アラーム・ルール 警告 クリティカル 内容
5

ヘルス

メトリック名: Health

警告MQL:

Health[1m]{HealthState = "Warning"}.mean() = 1

クリティカルMQL:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

PIAの健康

警告アラームは、状態'warning'が1に等しい場合に起動されます。

クリティカル・アラームは、状態'critical'が1の場合に起動されます。

5

ロード

メトリック名: Load

警告MQL:

Load[1m]{LoadState = "Medium"}.mean() = 1

クリティカルMQL:

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

PIAの総負荷。

状態'medium'が1の場合、警告アラームが起動されます。

状態'heavy'が1の場合、クリティカル・アラームが起動されます。

5

待機状態ソケット

メトリック名: WaitStateSockets

警告MQL:

WaitStateSockets[5m].mean() > 100
> 100 なし WAIT状態のWebサーバー・ソケットの数。100個を超えるWebサーバーソケットがWAIT状態の場合は、警告アラームが起動されます。
5

致命的エラー

メトリック名: FatalErrors

警告MQL:

FatalErrors[5m].mean() > 0
> 0 なし JOLTServiceサーブレット・ログの致命的なエラーの数。JOLTServiceサーブレットでエラーが発生した場合は、警告アラームが起動されます。

PeopleSoft検索エンジン

  • リソース・タイプ: PeopleSoft Elasticsearch、PeopleSoft OpenSearch
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: elastic_search, open_search
評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

クラスタ・ヘルス

メトリック名: ClusterHealth

MQL:

ClusterHealth[1m]{Status = "Red"}.mean() = 1ClusterHealth[1m]{Status = "Yellow"}.mean() = 1
1 1

検索エンジン・クラスタの全体的なヘルス。

ステータス'yellow'が1の場合、警告アラートがトリガーされます。

ステータス'red'が1の場合、クリティカル・アラートがトリガーされます。

10

メモリー使用率

メトリック名: MemoryUsage

MQL:

MemoryUsage[10m].mean()
> 80 > 90

検索エンジン・ノードの最大構成済ヒープ。

メモリー使用率が80%を超えると、警告アラートがトリガーされます。

メモリー使用率が90%を超えると、クリティカル・アラートがトリガーされます。

PeopleSoftプロセス・モニター

  • リソース・タイプ: PeopleSoftプロセス・モニター
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: oracle_psft_prcm
評価期間(分) アラーム・ルール 警告 クリティカル 内容
5

アクティブな分散の状態

メトリック名: ActiveDistributionState

MQL:

ActiveDistributionState[5m]{State = "NotPosted"}.mean() > 1
なし > 1

配布のポストされていない状態にあるプロセスが多すぎると、クリティカル・アラートがトリガーされます。

5

実行ステータス

メトリック名: ActiveRunState

MQL:

ActiveRunState[5m]{State = "NoSuccess"}.mean() > 1
なし > 1

実行中の成功状態でないプロセスが多すぎる場合は、クリティカル・アラートがトリガーされます。

5

実行ステータス

メトリック名: RunStatus

MQL:

RunStatus[5m]{Status = "Error"}.mean() > 0
なし > 0

実行エラー状態のプロセスが多すぎる場合は、クリティカル・アラートがトリガーされます。

Oracle Weblogic Server

サンプル・アラーム・ルール: Oracle Weblogic Server

  • リソース・タイプ: OracleWeblogicサーバー
  • メトリック・ネームスペース: oracle_appmgmt
  • リソース・グループ: weblogic_j2eeserver
評価期間(分) アラーム・ルール 警告 クリティカル Description
3

WebLogicサーバーが停止しています

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

なし なし 特定のコンパートメント・レポート内のWebLogicサーバーのクリティカル・アラームが停止しているか、3分以上ステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuUtilization

警告MQL:

CpuUtilization[5m].mean() > 80

クリティカルMQL:

CpuUtilization[5m].mean() > 90

> 80 > 90

特定のコンパートメント内のWebLogicサーバーの警告アラームで、過去5分間のCPU使用率が80%を超えていることがレポートされます。

特定のコンパートメント内のWebLogicサーバーのクリティカル・アラームで、過去5分間における90%を超えるCPU使用率がレポートされます。

5

高ヒープ使用率

メトリック名: JVMMemroyUtilization

警告MQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80

クリティカルMQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90
> 80 > 90

過去5分間の80%を超えるヒープ使用率をレポートする特定のコンパートメント内のWebLogicサーバーの警告アラーム。

過去5分間の90%以上のヒープ使用率をレポートする特定のコンパートメント内のWebLogicサーバーのクリティカル・アラーム。

5

ワーク・マネージャ・スタック・スレッド

メトリック名: WorkManagerStuckThreads

警告:

WorkManagerStuckThreads[5m].mean() > 10

クリティカル:

WorkManagerStuckThreads[5m].mean() > 15
> 10 > 15

10を超えるワーク・マネージャ・スタック・スレッドを過去5分間レポートしている特定のコンパートメント内のWebLogicサーバーの警告アラーム。

15を超えるワーク・マネージャ・スタック・スレッドを過去5分間レポートする特定のコンパートメント内のWebLogicサーバーのクリティカル・アラーム。

5

接続リクエスト待機中

メトリック名:

ServerConnectionPoolConnections

警告MQL:

ServerConnectionPoolConnections[5m].mean() > 1

クリティカルMQL:

ServerConnectionPoolConnections[5m].mean() > 2

>1 >2  
5

Webリクエスト処理時間

メトリック名: WebRequestProcessingTime

警告:

WebRequestProcessingTime[5m].mean() > 10000

クリティカル:

WebRequestProcessingTime[5m].mean() > 15000
>10000 >15000  
5

アクティブ・スレッド・プール・スレッド

メトリック名: ThreadPoolThreads

警告:

ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1000

クリティカル:

ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1250
>1000 >1250  

サンプル・アラーム・ルール: Oracle Weblogic Serverクラスタ

  • リソース・タイプ: Oracle Weblogic Serverクラスタ

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: weblogic_cluster

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

WebLogicクラスタが停止しています

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のWebLogicクラスタのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。

アラーム・ルールの例: Oracle HTTP Server (OHS)

  • リソース・タイプ: Oracle HTTP Server

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_http_server

評価期間(分) アラーム・ルール 警告 クリティカル 内容
3

Oracle HTTP Serverが停止中です

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

なし なし 特定のコンパートメント・レポート内のOracle HTTP Serverのクリティカル・アラームが停止しているか、3分以上ステータスを報告していません。
5

高いCPU使用率

メトリック名: CPUUtilization

警告MQL:

CPUUtilization[5m].mean() > 80

クリティカルMQL:

CPUUtilization[5m].mean() > 90
>80 >90

特定のコンパートメント内のOracle HTTP Serverの警告アラームで、過去5分間のCPU使用率が80%を超えていることがレポートされます。

特定のコンパートメント内のOracle HTTP Serverのクリティカル・アラームは、過去5分間、90%を超えるCPU使用率を報告します。

5

高いメモリー使用率

メトリック名: MemoryUtilization

警告MQL:

MemoryUtilization[5m].mean() > 80

クリティカルMQL:

MemoryUtilization[5m].mean() > 90

>80 >90

特定のコンパートメント内のOracle HTTP Serverの警告アラームで、過去5分間の80%を超えるメモリー使用率がレポートされます。

特定のコンパートメント内のOracle HTTP Serverのクリティカル・アラームで、過去5分間90%を超えるメモリー使用率がレポートされます。

5

高Webリクエスト処理時間

メトリック名: WebRequestProcessingTime

警告MQL:

WebRequestProcessingTime[5m].mean() > 1500

クリティカルMQL:

WebRequestProcessingTime[5m].mean() > 3000

>1500 >3000

1500ミリ秒を超える特定のコンパートメント内のOracle HTTP Serverの警告アラームは、過去5分間のWebリクエスト処理時間を平均します。

3000ミリ秒を超える特定のコンパートメント内のOracle HTTP Serverのクリティカル・アラームは、過去5分間のWebリクエスト処理時間を意味します。

Oracle Identity Manager (OIM)

サンプル・アラーム・ルール: Oracle Identity Manager (OIM)

  • リソース・タイプ: Oracle Identity Manager/Oracle Identity Managerクラスタ

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_oim / oracle_oim_cluster

評価期間(分) アラーム 警告 クリティカル Description
1

モニタリング・ステータス

メトリック名: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし < 1

OIMクラスタ/サーバーの可用性ステータス。

応答値が1以外の場合、クリティカル・アラートがトリガーされます。

15

オーケストレーション- 平均実行時間

メトリック名: Orchestration-AverageExecutionTime

MQL:

Orchestration-AverageExecutionTime[15m].mean() > 300 Orchestration-AverageExecutionTime[15m].mean() > 500
> 300 > 500

オーケストレーション平均実行時間

オーケストレーションの平均実行時間が300ミリ秒を超えると、警告アラートがトリガーされます

オーケストレーションの平均実行時間が500ミリ秒を超えると、クリティカル・アラートがトリガーされます

Oracle Access Manager (OAM)

サンプル・アラーム・ルール: Oracle Access Manager (OAM)

  • リソース・タイプ: Oracle Access Manager/Oracle Access Managerクラスタ

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_oam / oracle_oam_cluster

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

モニタリング・ステータス

メトリック名: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし < 1

OAMクラスタ/サーバーの可用性ステータス。

応答値が1以外の場合、クリティカル・アラートがトリガーされます。

5

認可レイテンシ

メトリック名: AuthorizationLatency

MQL:

authorizationLatency[5m].mean() > 300 authorizationLatency[5m].mean() > 500
> 500 > 800

認証レイテンシ

認可レイテンシが500ミリ秒を超えると、警告アラートがトリガーされます

認可レイテンシが800ミリ秒を超えると、クリティカル・アラートがトリガーされます

Oracle JVM

リソース・タイプ: Oracle JVMランタイム

ServerMetricネームスペース: oracle_appmgmt

リソース・グループ: oracle_jvm

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

Oracle JVMランタイム停止

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean()!=1||MonitoringStatus[1m].absent()
なし なし Oracle JVMランタイムに接続できなくなったクリティカル・アラーム
5

メモリー・プール使用率

メトリック名: MemoryPoolUtilization

ディメンション名: Type

ディメンション値: Used

警告MQL:

MemoryPoolUtilization[5m]{Type="Used"}.mean()>80%

クリティカルMQL:

MemoryPoolUtilization[5m]{Type=Used"}.mean()>90%
>80% >90% 使用可能な最大値に対するメモリー・プールで使用されているメモリーの割合
5

使用済ヒープ・メモリー使用率

メトリック名:

HeapMemoryUtilization

ディメンション名: Type

ディメンション値: Used

警告MQL:

HeapMemoryUtilization[5m]{Type="Used"}.mean()>80%

クリティカルMQL:

HeapMemoryUtilization[5m]{Type = "Used"}.mean() >90%
>80% >90% 使用可能な最大値に対するヒープ・メモリーの使用済メモリーの割合。
5

ヒープ以外の使用済メモリー使用率

メトリック名:

NonHeapMemoryUtilization

ディメンション名: Type

ディメンション値: Used

警告MQL:

NonHeapMemoryUtilization[5m]{Type="Used"}.mean()>80%

クリティカルMQL:

NonHeapMemoryUtilization[5m]{Type = "Used"}.mean() >90%
>80% >90% 使用可能な最大値に対する非ヒープ・メモリーで使用されたメモリーの割合。
5

CPU使用率

メトリック名:

CPUUtilization

警告MQL:

CPUUtilization[5m]. mean() > 80%

クリティカルMQL:

CPUUtilization[5m]. mean() > 90%
>80% >90% JVMプロセスによって消費されたCPUリソースの割合

Apache HTTP Server

リソース・タイプ: Apache HTTP

ServerMetricネームスペース: oracle_appmgmt

リソース・グループ: apache_http_server

評価期間(分) アラーム・ルール 警告 クリティカル Description
3

Apache HTTP Serverが停止しています

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

なし なし 特定のコンパートメント内のApache HTTP Serverのクリティカル・アラームが停止しているか、3分以上ステータスを報告していません。
5

高いCPU使用率

メトリック名: CPUUtilization

警告MQL:

CPUUtilization[5m].mean() > 80

クリティカルMQL:

CPUUtilization[5m].mean() > 90

>80 >90

特定のコンパートメント内のApache HTTP Serverの警告アラームで、過去5分間、80%を超えるCPU使用率がレポートされます。

特定のコンパートメント内のApache HTTP Serverのクリティカル・アラームで、過去5分間90%を超えるCPU使用率がレポートされます。

5

高いメモリー使用率

メトリック名: MemoryUtilization

警告MQL:

MemoryUtilization[5m].mean() > 80

クリティカルMQL:

MemoryUtilization[5m].mean() > 90

>80 >90

特定のコンパートメント内のApache HTTP Serverの警告アラームで、過去5分間、80%を超えるメモリー使用率がレポートされます。

特定のコンパートメント内のApache HTTP Serverのクリティカル・アラームで、過去5分間90%を超えるメモリー使用率がレポートされます。

5

高Webリクエスト処理時間

メトリック名: WebRequestProcessingTime

警告MQL:

WebRequestProcessingTime[5m].mean() > 1500

クリティカルMQL:

WebRequestProcessingTime[5m].mean() > 3000

>1500 >3000

1500ミリ秒を超える特定のコンパートメント内のApache HTTP Serverの警告アラームは、過去5分間のWebリクエスト処理時間を平均します。

3000ミリ秒を超える特定のコンパートメント内のApache HTTP Serverのクリティカル・アラームは、過去5分間のWebリクエスト処理時間を意味します。

Oracle Unified Directory

サンプル・アラーム・ルール: Oracle Unified Directory(OUD)

  • リソース・タイプ: Oracle Unified Directory

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oud_directoryoud_proxyoud_gateway

アラーム 警告 クリティカル Description

モニタリング・ステータス

メトリック名: oud_base_status

MQL:

oud_base_status[1m].mean() != 1 || oud_base_status[1m].absent()
なし < 1

OUDサーバーの可用性ステータス。

応答値が1未満の場合、クリティカル・アラートがトリガーされます。

接続ハンドラ状態

メトリック名: ConnectionHandlerState

MQL:

ConnectionHandlerState[1m].mean() < 1
なし <1

接続ハンドラ状態

接続ハンドラの状態が1未満の場合、クリティカル・アラートがトリガーされます。

バックエンド・エントリ

メトリック名: BackendEntries

警告MQL:

BackendEntries[5m].mean() > 30

クリティカルMQL:

BackendEntries[5m].mean() > 50
> 30 >50

バックエンド・エントリ

バックエンド・エントリ時間が30を超えると、警告アラートがトリガーされます。

バックエンド・エントリが50を超えると、クリティカル・アラートがトリガーされます。

接続ハンドラのすべての常駐時間

メトリック名: ConnectionHandlerAllResidentTime

警告MQL:

ConnectionHandlerAllResidentTime[5m].mean() > 300

クリティカルMQL:

ConnectionHandlerAllResidentTime[5m].mean() > 500
> 300 > 500

接続ハンドラのすべての常駐時間

接続ハンドラの「すべての常駐時間」が60より大きい場合、警告アラートがトリガーされます。

接続ハンドラのすべての常駐時間が90を超えると、クリティカル・アラートがトリガーされます。

接続ハンドラの接続

メトリック名: ConnectionHandlerConnections

警告MQL:

ConnectionHandlerConnections[5m].mean() > 30

クリティカルMQL:

ConnectionHandlerConnections[5m].mean() > 50
> 30 >50

接続ハンドラの接続

接続ハンドラ接続が30を超えると、警告アラートがトリガーされます。

接続ハンドラ接続が50を超えると、クリティカル・アラートがトリガーされます。

JVM使用済メモリー

メトリック名: JVMUsedMemory

警告MQL:

JVMUsedMemory[5m].mean() > 1.5

クリティカルMQL:

JVMUsedMemory[5m].mean() > 3
> 1.5 > 3

JVM使用済メモリー

JVM使用済メモリーが1.5MBを超えると、警告アラートがトリガーされます。

JVM使用済メモリーが3MBを超えると、クリティカル・アラートがトリガーされます。

OS使用済メモリー

メトリック名: OSUsedMemory

警告MQL:

OSUsedMemory[5m].mean() > 1.5

クリティカルMQL:

OSUsedMemory[5m].mean() > 3
> 1.5 > 3

OS使用済メモリー

OS使用済メモリーが1.5MBを超えると、警告アラートがトリガーされます。

OS使用済メモリーが3MBを超えると、クリティカル・アラートがトリガーされます。

レプリケーション・ドメインの状態

メトリック名: ReplicationDomainState

MQL:

ReplicationDomainState[5m].mean() < 1
なし < 1

レプリケーションドメインの状態

レプリケーション・ドメインの状態が1未満の場合、クリティカル・アラートがトリガーされます。

WFE常駐時間操作の合計時間

メトリック名: WFEResidentTimeOperationsTotalTime

警告MQL:

WFEResidentTimeOperationsTotalTime[5m].mean() > 60

クリティカルMQL:

WFEResidentTimeOperationsTotalTime[5m].mean() > 90
> 60 > 90

WFE常駐時間操作の合計時間

WFE常駐時間操作合計時間が60を超えると、警告アラートがトリガーされます。

WFE常駐時間操作合計時間が90を超えると、クリティカル・アラートがトリガーされます。

作業キュー現行バックログ

メトリック名: WorkQueueCurrentBacklog

警告MQL:

WorkQueueCurrentBacklog[5m].mean() > 15

クリティカルMQL:

WorkQueueCurrentBacklog[5m].mean() > 30
> 15 > 30

作業キュー現行バックログ

ワーク・キューの現在のバックログが15より大きい場合、警告アラートがトリガーされます。

作業キューの現在のバックログが30より大きい場合、クリティカル・アラートがトリガーされます。

拡張LDAP接続

メトリック名: ExtensionLDAPConnections

警告MQL:

ExtensionLDAPConnections[5m].mean() > 30

クリティカルMQL:

ExtensionLDAPConnections[5m].mean() > 50
> 30 > 50

拡張LDAP接続

拡張LDAP接続が30より大きい場合、警告アラートがトリガーされます。

拡張LDAP接続が50を超えると、クリティカル・アラートがトリガーされます。

拡張LDAP操作合計レスポンス時間

メトリック名: ExtensionLDAPOperationsTotalResponseTime

警告MQL:

ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 60

クリティカルMQL:

ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 90
> 60 > 90

拡張LDAP操作合計レスポンス時間

拡張LDAP操作の合計レスポンス時間が60を超えると、警告アラートがトリガーされます。

拡張LDAP操作の合計レスポンス時間が90を超えると、クリティカル・アラートがトリガーされます。

Oracle GoldenGate

サンプル警報規則: Goldengate

  • リソース・タイプ: Oracle Goldengate

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

Goldengate Down

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengateのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。

サンプル・アラーム・ルール: Goldengate AdminServer

  • リソース・タイプ: Goldengate管理サーバー

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_admin_server

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

Goldengate管理サーバー停止

メトリック名: MonitoringStatusCritical

MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント内のGoldengate AdminServerのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名:CpuTimeUtilizationPercentage

警告MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

クリティカルMQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 特定のコンパートメント内のGoldengate管理サーバーについて、過去5分間のCPU使用率が80%を超えていることを示す警告アラーム。特定のコンパートメント内のGoldengate管理サーバーのクリティカル・アラームで、過去5分間90%を超えるCPU使用率がレポートされます。
5

プライベート・メモリー

メトリック名: PrivateMemory

警告MQL:

PrivateMemory[5m].mean() > 30

クリティカルMQL:

PrivateMemory[5m].mean() > 40
30 40 プライベート・メモリーの平均が過去5分間30 GBを超えると、警告アラートがトリガーされます。プライベート・メモリーの平均が過去5分間40 GBを超えると、クリティカル・アラートがトリガーされます。
5

I/O読取り率

メトリック名: IOReadRate

警告MQL:

IOReadRate[5m].mean() > 10

クリティカルMQL:

IOReadRate[5m].mean() > 20
10 20 I/O読取り率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O読取り率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

I/O書込み率

メトリック名: IOWriteRate

警告MQL:

IOWriteRate[5m].mean() > 10

クリティカルMQL:

IOWriteRate[5m].mean() > 20
10 20 I/O書込み率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O書込み率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ドロップ・パケット率

メトリック名: DroppedPacketRate

警告MQL:

DroppedPacketRate[5m].mean() > 30

クリティカルMQL:

DroppedPacketRate[5m].mean() > 40
30 40 過去5分間、ドロップされたパケット・レートの平均が30メッセージ/分を超えると、警告アラートがトリガーされます。過去5分間、ドロップされたパケット・レートの平均が40メッセージ/分を超えると、クリティカル・アラートがトリガーされます。
5

欠落パケット率

メトリック名: MissingPacketRate

警告MQL:

MissingPacketRate[5m].mean() > 30

クリティカルMQL:

MissingPacketRate[5m].mean() > 40
30 40 欠落パケット率の平均が過去5分間30メッセージ/分を超えた場合、警告アラートがトリガーされます。欠落パケット・レート平均が過去5分間40メッセージ/分より大きい場合は、クリティカル・アラートがトリガーされます。
5

パケット・エラー率

メトリック名: PacketErrorRate

警告MQL:

PacketErrorRate[5m].mean() > 30

クリティカルMQL:

PacketErrorRate[5m].mean() > 40
30 40 パケット・エラー率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット・エラー率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

パケット受信率

メトリック名: PacketReceiveRate

警告MQL:

PacketReceiveRate[5m].mean() > 30

クリティカルMQL:

PacketReceiveRate[5m].mean() > 40
30 40

パケット受信率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。

過去5分間、パケット受信率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。

サンプルアラームルール: Goldengate配布サービス

  • リソース・タイプ: Goldengateディストリビューション・サービス

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_distribution_server

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

Goldengate配送サービス

メトリック名: MonitoringStatus

クリティカルMQL:MonitoringStatus

[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengate Distribution Serviceのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuTimeUtilizationPercentage

警告MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

クリティカルMQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 特定のコンパートメント内のGoldengate Distribution Serviceの警告アラームで、過去5分間のCPU使用率が80%を超えていることがレポートされます。特定のコンパートメント内のGoldengate Distribution Serviceのクリティカル・アラームで、過去5分間における90%を超えるCPU使用率がレポートされます。
5

プライベート・メモリー

メトリック名: PrivateMemory

警告MQL:

PrivateMemory[5m].mean() > 30

クリティカルMQL:

PrivateMemory[5m].mean() > 40
30 40 プライベート・メモリーの平均が過去5分間30 GBを超えると、警告アラートがトリガーされます。プライベート・メモリーの平均が過去5分間40 GBを超えると、クリティカル・アラートがトリガーされます。
5

I/O読取り率

メトリック名: IOReadRate

警告MQL:

IOReadRate[5m].mean() > 10

クリティカルMQL:

IOReadRate[5m].mean() > 20
10 20 I/O読取り率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O読取り率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

I/O書込み率

メトリック名: IOWriteRate

警告MQL:

IOWriteRate[5m].mean() > 10

クリティカルMQL:

IOWriteRate[5m].mean() > 20
10 20 I/O書込み率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O書込み率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ドロップ・パケット率

メトリック名: DroppedPacketRate

警告MQL:

DroppedPacketRate[5m].mean() > 30

クリティカルMQL:

DroppedPacketRate[5m].mean() > 40
30 40 過去5分間、ドロップされたパケット・レートの平均が30メッセージ/分を超えると、警告アラートがトリガーされます。過去5分間、ドロップされたパケット・レートの平均が40メッセージ/分を超えると、クリティカル・アラートがトリガーされます。
5

欠落パケット率

メトリック名: MissingPacketRate

警告MQL:

MissingPacketRate[5m].mean() > 30

クリティカルMQL:

MissingPacketRate[5m].mean() > 40
30 40 欠落パケット率の平均が過去5分間30メッセージ/分を超えた場合、警告アラートがトリガーされます。欠落パケット・レート平均が過去5分間40メッセージ/分より大きい場合は、クリティカル・アラートがトリガーされます。
5

パケット・エラー率

メトリック名: PacketErrorRate

警告MQL:

PacketErrorRate[5m].mean() > 30

クリティカルMQL:

PacketErrorRate[5m].mean() > 40
30 40 パケット・エラー率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット・エラー率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

パケット受信率

メトリック名: PacketReceiveRate

警告MQL:

PacketReceiveRate[5m].mean() > 30

クリティカルMQL:

PacketReceiveRate[5m].mean() > 40
30 40 パケット受信率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット受信率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。

サンプル警報規則: Goldengateの受信機サービス

  • リソース・タイプ: Goldengate受信者サービス

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_receiver_server

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

Goldengate受信者サービス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 指定されたコンパートメントのGoldengateレシーバ・サービスのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuTimeUtilizationPercentage

警告MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

クリティカルMQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 特定のコンパートメントのGoldengateレシーバ・サービスの警告アラームで、過去5分間のCPU使用率が80%を超えていることがレポートされます。特定のコンパートメント内のGoldengateレシーバ・サービスのクリティカル・アラームで、過去5分間における90%を超えるCPU使用率がレポートされます。
5

プライベート・メモリー

メトリック名: PrivateMemory

警告MQL:

PrivateMemory[5m].mean() > 30

クリティカルMQL:

PrivateMemory[5m].mean() > 40
30 40 プライベート・メモリーの平均が過去5分間30 GBを超えると、警告アラートがトリガーされます。プライベート・メモリーの平均が過去5分間40 GBを超えると、クリティカル・アラートがトリガーされます。
5

I/O読取り率

メトリック名: IOReadRate

警告MQL:

IOReadRate[5m].mean() > 10

クリティカルMQL:

IOReadRate[5m].mean() > 20
10 20 I/O読取り率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O読取り率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

I/O書込み率

メトリック名: IOWriteRate

警告MQL:

IOWriteRate[5m].mean() > 10

クリティカルMQL:

IOWriteRate[5m].mean() > 20
10 20 I/O書込み率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O書込み率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ドロップ・パケット率

メトリック名: DroppedPacketRate p

警告MQL:

DroppedPacketRate[5m].mean() > 30

クリティカルMQL:

DroppedPacketRate[5m].mean() > 40
30 40 過去5分間、ドロップされたパケット・レートの平均が30メッセージ/分を超えると、警告アラートがトリガーされます。過去5分間、ドロップされたパケット・レートの平均が40メッセージ/分を超えると、クリティカル・アラートがトリガーされます。
5

欠落パケット率

メトリック名: MissingPacketRate

警告MQL:

MissingPacketRate[5m].mean() > 30

クリティカルMQL:

MissingPacketRate[5m].mean() > 40
30 40 欠落パケット率の平均が過去5分間30メッセージ/分を超えた場合、警告アラートがトリガーされます。欠落パケット・レート平均が過去5分間40メッセージ/分より大きい場合は、クリティカル・アラートがトリガーされます。
5

パケット・エラー率

メトリック名: PacketErrorRate

警告MQL:

PacketErrorRate[5m].mean() > 30

クリティカルMQL:

PacketErrorRate[5m].mean() > 40
30 40 パケット・エラー率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット・エラー率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

パケット受信率

メトリック名: PacketReceiveRate

警告MQL:

PacketReceiveRate[5m].mean() > 30

クリティカルMQL:

PacketReceiveRate[5m].mean() > 40
30 40 パケット受信率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット受信率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。

サンプル・アラーム・ルール: Goldengateサービス・マネージャ

  • リソース・タイプ: Goldengate Service Manager

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_service_manager

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

Goldengateサービス・マネージャー

メトリック名: MonitoringStatus

StatusCritical MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengate Service Managerのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。

サンプル・アラーム・ルール: Goldengateパフォーマンス・メトリック・サービス

  • リソース・タイプ: Goldengateパフォーマンス・メトリック・サービス

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_pm_server

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

Goldengateパフォーマンス・メトリック・サービス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengateパフォーマンス・メトリック・サービスのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuTimeUtilizationPercentage

警告MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

クリティカルMQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 特定のコンパートメントのGoldengateパフォーマンス・メトリック・サービスの警告アラームで、過去5分間のCPU使用率が80%を超えていることがレポートされます。特定のコンパートメント内のGoldengateパフォーマンス・メトリック・サービスのクリティカル・アラームで、過去5分間における90%を超えるCPU使用率がレポートされます。
5

プライベート・メモリー

メトリック名: PrivateMemory

警告MQL:

PrivateMemory[5m].mean() > 30

クリティカルMQL:

PrivateMemory[5m].mean() > 40
30 40 プライベート・メモリーの平均が過去5分間30 GBを超えると、警告アラートがトリガーされます。プライベート・メモリーの平均が過去5分間40 GBを超えると、クリティカル・アラートがトリガーされます。
5

I/O読取り率

メトリック名: IOReadRate

警告MQL:

IOReadRate[5m].mean() > 10

クリティカルMQL:

IOReadRate[5m].mean() > 20
10 20 I/O読取り率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O読取り率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

I/O書込み率

メトリック名: IOWriteRate

警告MQL:

IOWriteRate[5m].mean() > 10

クリティカルMQL:

IOWriteRate[5m].mean() > 20
10 20 I/O書込み率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O書込み率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。

サンプル警報規則:Goldengateのエキス

  • リソース・タイプ: Goldengate抽出

  • リソース・タイプ: goldengate_extract

  • リソース・グループ: oracle_goldengate_extract

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

Goldengateエキス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengate Extractのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuTimeUtilizationPercentage

警告MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

クリティカルMQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 特定のコンパートメント内のGoldengate Extractの警告アラームで、過去5分間、80%を超えるCPU使用率がレポートされます。特定のコンパートメント内のGoldengate Extractのクリティカル・アラームで、過去5分間、90%を超えるCPU使用率がレポートされます。
5

プライベート・メモリー

メトリック名: PrivateMemory

警告MQL:

PrivateMemory[5m].mean() > 30

クリティカルMQL:

PrivateMemory[5m].mean() > 40
30 40 プライベート・メモリーの平均が過去5分間30 GBを超えると、警告アラートがトリガーされます。プライベート・メモリーの平均が過去5分間40 GBを超えると、クリティカル・アラートがトリガーされます。
5

I/O読取り率

メトリック名: IOReadRate

警告MQL:

IOReadRate[5m].mean() > 10

クリティカルMQL:

IOReadRate[5m].mean() > 20
10 20 I/O読取り率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O読取り率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

I/O書込み率

メトリック名: IOWriteRate

警告MQL:

IOWriteRate[5m].mean() > 10

クリティカルMQL:

IOWriteRate[5m].mean() > 20
10 20 I/O書込み率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O書込み率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ドロップ・パケット率

メトリック名: DroppedPacketRate

警告MQL:

DroppedPacketRate[5m].mean() > 30

クリティカルMQL:

DroppedPacketRate[5m].mean() > 40
30 40 過去5分間、ドロップされたパケット・レートの平均が30メッセージ/分を超えると、警告アラートがトリガーされます。過去5分間、ドロップされたパケット・レートの平均が40メッセージ/分を超えると、クリティカル・アラートがトリガーされます。
5

欠落パケット率

メトリック名: MissingPacketRate

警告MQL:

MissingPacketRate[5m].mean() > 30

クリティカルMQL:

MissingPacketRate[5m].mean() > 40
30 40 欠落パケット率の平均が過去5分間30メッセージ/分を超えた場合、警告アラートがトリガーされます。欠落パケット・レート平均が過去5分間40メッセージ/分より大きい場合は、クリティカル・アラートがトリガーされます。
5

パケット・エラー率

メトリック名: PacketErrorRate

警告MQL:

PacketErrorRate[5m].mean() > 30

クリティカルMQL:

PacketErrorRate[5m].mean() > 40
30 40 パケット・エラー率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット・エラー率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

パケット受信率

メトリック名: PacketReceiveRate

警告MQL:

PacketReceiveRate[5m].mean() > 30

クリティカルMQL:

PacketReceiveRate[5m].mean() > 40
30 40 パケット受信率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット受信率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

マップされた削除率

メトリック名: MappedDeleteRate

警告MQL:

MappedDeleteRate[5m].mean() > 30

クリティカルMQL:

MappedDeleteRate[5m].mean() > 40
30 40 過去5分間、マップ済削除率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済削除率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

マップされた挿入率

メトリック名: MappedInsertRate

警告MQL:

MappedInsertRate[5m].mean() > 30

クリティカルMQL:

MappedInsertRate[5m].mean() > 40
30 40 過去5分間、マップ済挿入率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済挿入率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

マップされた切捨て率

メトリック名: MappedTruncateRate

警告MQL:

MappedTruncateRate[5m].mean() > 30

クリティカルMQL:

MappedTruncateRate[5m].mean() > 40
30 40 過去5分間、マップ済切捨て率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済切捨て率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

マップされた更新率

メトリック名: MappedUpdateRate

警告MQL:

MappedUpdateRate[5m].mean() > 30

クリティカルMQL:

MappedUpdateRate[5m].mean() > 40
30 40 過去5分間、マップ済更新率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済更新率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

破棄率

メトリック名: DiscardRate

警告MQL:

DiscardRate[5m].mean() > 30

クリティカルMQL:

DiscardRate[5m].mean() > 40
30 40 破棄率の平均が過去5分間30MB/秒を超えると、警告アラートがトリガーされます。破棄率の平均が過去5分間40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

無視率

メトリック名: IgnoreRate

警告MQL:

IgnoreRate[5m].mean() > 30

クリティカルMQL:

IgnoreRate[5m].mean() > 40
30 40 無視率の平均が過去5分間30MB/秒を超えると、警告アラートがトリガーされます。無視率の平均が過去5分間40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

Lag

メトリック名: Lag

警告MQL:

Lag[5m].mean() > 10

クリティカルMQL:

Lag[5m].mean() > 20
10 20 過去5分間ラグ平均が10秒を超えた場合、警告アラートがトリガーされます。過去5分間ラグ平均が20秒を超えると、クリティカル・アラートがトリガーされます。
5

操作率

メトリック名: OperationsPerSec

警告MQL:

OperationsPerSec[5m].mean() > 30

クリティカルMQL:

OperationsPerSec[5m].mean() > 40
20 30 操作率の平均が過去5分間20操作/秒を超えると、警告アラートがトリガーされます。過去5分間、操作率の平均が30 Ops/秒を超えると、クリティカル・アラートがトリガーされます。

アラーム・ルールの例: Goldengate Replicat

  • リソース・タイプ: Goldengate Replicat

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_replicat

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

Goldengate Replicat

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengate Replicatのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuTimeUtilizationPercentage

警告MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

クリティカルMQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 特定のコンパートメント内のGoldengate Replicatの警告アラームで、過去5分間における80%を超えるCPU使用率がレポートされます。特定のコンパートメント内のGoldengate Replicatのクリティカル・アラームで、過去5分間90%を超えるCPU使用率がレポートされます。
5

プライベート・メモリー

メトリック名: PrivateMemory

警告MQL:

PrivateMemory[5m].mean() > 30

クリティカルMQL:

PrivateMemory[5m].mean() > 40
30 40 プライベート・メモリーの平均が過去5分間30 GBを超えると、警告アラートがトリガーされます。プライベート・メモリーの平均が過去5分間40 GBを超えると、クリティカル・アラートがトリガーされます。
5

I/O読取り率

メトリック名: IOReadRate

警告MQL:

IOReadRate[5m].mean() > 10

クリティカルMQL:

IOReadRate[5m].mean() > 20
10 20 I/O読取り率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O読取り率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

I/O書込み率

メトリック名: IOWriteRate

警告MQL:

IOWriteRate[5m].mean() > 10

クリティカルMQL:

IOWriteRate[5m].mean() > 20
10 20 I/O書込み率の平均が過去5分間10MB/秒を超えると、警告アラートがトリガーされます。I/O書込み率の平均が過去5分間20MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ドロップ・パケット率

メトリック名: DroppedPacketRate

警告MQL:

DroppedPacketRate[5m].mean() > 30

クリティカルMQL:

DroppedPacketRate[5m].mean() > 40
30 40 過去5分間、ドロップされたパケット・レートの平均が30メッセージ/分を超えると、警告アラートがトリガーされます。過去5分間、ドロップされたパケット・レートの平均が40メッセージ/分を超えると、クリティカル・アラートがトリガーされます。
5

欠落パケット率

メトリック名: MissingPacketRate

警告MQL:

MissingPacketRate[5m].mean() > 30

クリティカルMQL:

MissingPacketRate[5m].mean() > 40
30 40 欠落パケット率の平均が過去5分間30メッセージ/分を超えた場合、警告アラートがトリガーされます。欠落パケット・レート平均が過去5分間40メッセージ/分より大きい場合は、クリティカル・アラートがトリガーされます。
5

パケット・エラー率

メトリック名:

PacketErrorRate

警告MQL:

PacketErrorRate[5m].mean() > 30

クリティカルMQL:

PacketErrorRate[5m].mean() > 40
30 40 パケット・エラー率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット・エラー率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

パケット受信率

メトリック名: PacketReceiveRate

警告MQL:

PacketReceiveRate[5m].mean() > 30

クリティカルMQL:

PacketReceiveRate[5m].mean() > 40
30 40 パケット受信率平均が過去5分間30メッセージ/分より大きい場合、警告アラートがトリガーされます。過去5分間、パケット受信率平均が40メッセージ/分を超えた場合、クリティカル・アラートがトリガーされます。
5

マップされた削除率

メトリック名: MappedDeleteRate

警告MQL:

MappedDeleteRate[5m].mean() > 30

クリティカルMQL:

MappedDeleteRate[5m].mean() > 40
30 40 過去5分間、マップ済削除率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済削除率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

マップされた挿入率

メトリック名: MappedInsertRate

警告MQL:

MappedInsertRate[5m].mean() > 30

クリティカルMQL:

MappedInsertRate[5m].mean() > 40
30 40 過去5分間、マップ済挿入率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済挿入率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

マップされた切捨て率

メトリック名: MappedTruncateRate

警告MQL:

MappedTruncateRate[5m].mean() > 30

クリティカルMQL:

MappedTruncateRate[5m].mean() > 40
30 40 過去5分間、マップ済切捨て率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済切捨て率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

マップされた更新率

メトリック名: MappedUpdateRate

警告MQL:

MappedUpdateRate[5m].mean() > 30

クリティカルMQL:

MappedUpdateRate[5m].mean() > 40
30 40 過去5分間、マップ済更新率の平均が30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、マップ済更新率の平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

破棄率

メトリック名: DiscardRate

警告MQL:

DiscardRate[5m].mean() > 30

クリティカルMQL:

DiscardRate[5m].mean() > 40
30 40 破棄率の平均が過去5分間30MB/秒を超えると、警告アラートがトリガーされます。破棄率の平均が過去5分間40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

無視率

メトリック名: IgnoreRate

警告MQL:

IgnoreRate[5m].mean() > 30

クリティカルMQL:

IgnoreRate[5m].mean() > 40
30 40 無視率の平均が過去5分間30MB/秒を超えると、警告アラートがトリガーされます。無視率の平均が過去5分間40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

Lag

メトリック名: Lag

警告MQL:

Lag[5m].mean() > 30

クリティカルMQL:

Lag[5m].mean() > 40
10 20 過去5分間ラグ平均が10秒を超えた場合、警告アラートがトリガーされます。過去5分間ラグ平均が20秒を超えると、クリティカル・アラートがトリガーされます。
5

操作率

メトリック名: OperationsPerSec

警告MQL:

OperationsPerSec[5m].mean() > 30

クリティカルMQL:

OperationsPerSec[5m].mean() > 40
20 30 操作率の平均が過去5分間20操作/秒を超えると、警告アラートがトリガーされます。過去5分間、操作率の平均が30 Ops/秒を超えると、クリティカル・アラートがトリガーされます。

サンプルアラームルール: Goldengate配布パス

  • リソース・タイプ: Goldengate分散パス

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_distribution_path

評価期間(分) アラーム・ルール 警告 クリティカル Description
1

Goldengate分散パス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のGoldengate分散パスのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

Lag

メトリック名: Lag

警告MQL:

Lag[5m].mean() > 30

クリティカルMQL:

Lag[5m].mean() > 40
10 20 過去5分間ラグ平均が10秒を超えた場合、警告アラートがトリガーされます。過去5分間ラグ平均が20秒を超えると、クリティカル・アラートがトリガーされます。
5

ネットワーク送信率

メトリック名: NetworkSentRate

警告MQL:

NetworkSentRate[5m].mean() > 30

クリティカルMQL:

NetworkSentRate[5m].mean() > 40
30 40 ネットワーク送信レート平均が過去5分間30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、ネットワーク送信レート平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ネットワーク受信率

メトリック名: NetworkReceiveRate

警告MQL:

NetworkReceiveRate[5m].mean() > 30

クリティカルMQL:

NetworkReceiveRate[5m].mean() > 40
30 40 過去5分間、送信されたネットワーク受信平均が30MB/秒を超えると、警告アラートがトリガーされます。ネットワーク受信率の平均が過去5分間40MB/秒を超えると、クリティカル・アラートがトリガーされます。

サンプルアラームルール: Goldengate受信パス

  • リソース・タイプ: Goldengate受信パス

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_goldengate_receiver_path

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

Goldengate受信パス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 指定されたコンパートメントのGoldengateレシーバ・パスのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

Lag

メトリック名: Lag

警告MQL:

Lag[5m].mean() > 30

クリティカルMQL:

Lag[5m].mean() > 40
10 20 過去5分間ラグ平均が10秒を超えた場合、警告アラートがトリガーされます。過去5分間ラグ平均が20秒を超えると、クリティカル・アラートがトリガーされます。
5

ネットワーク送信率

メトリック名: NetworkSentRate

警告MQL:

NetworkSentRate[5m].mean() > 30

クリティカルMQL:

NetworkSentRate[5m].mean() > 40
30 40 ネットワーク送信レート平均が過去5分間30MB/秒を超えると、警告アラートがトリガーされます。過去5分間、ネットワーク送信レート平均が40MB/秒を超えると、クリティカル・アラートがトリガーされます。
5

ネットワーク受信率

メトリック名: NetworkReceiveRate

警告MQL:

NetworkReceiveRate[5m].mean() > 30

クリティカルMQL:

NetworkReceiveRate[5m].mean() > 40
30 40 過去5分間、送信されたネットワーク受信平均が30MB/秒を超えると、警告アラートがトリガーされます。ネットワーク受信率の平均が過去5分間40MB/秒を超えると、クリティカル・アラートがトリガーされます。

プロセスベースのカスタムリソースサンプルアラームルール

  • リソース・タイプ: カスタム・リソース

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: custom_resource

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

カスタム・リソース・ダウン

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント内のカスタム・リソースのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

高いCPU使用率

メトリック名: CpuUtilization

警告MQL:

CpuUtilization[1m].mean() > 80

クリティカルMQL:

CpuUtilization[1m].mean() > 90
>80 >90

特定のコンパートメント内のカスタム・リソースの警告アラームで、5分間のCPU使用率が80%を超えていることがレポートされます。

特定のコンパートメント内のカスタム・リソースのクリティカル・アラームで、5分間で90%を超えるCPU使用率がレポートされます。

15

高いメモリー使用率

メトリック名: MemoryUtilization

警告MQL:

MemoryUtilization[1m].mean() > 80

クリティカルMQL:

MemoryUtilization[1m].mean() > 90
>80 >90

特定のコンパートメント内のカスタム・リソースの警告アラームで、15分間のメモリー使用率が80%を超えていることがレポートされます。

特定のコンパートメント内のカスタム・リソースのクリティカル・アラームで、15分間で90%を超えるメモリー使用率がレポートされます。

Oracle Service Bus(OSB)

  • リソース・タイプ: Oracle Service Bus

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: oracle_servicebus

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

モニタリング・ステータス

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
なし なし 特定のコンパートメント・レポート内のService Busのクリティカル・アラームが停止しているか、1分を超えるステータスを報告していません。
5

Service Busエラー

メトリック名: ServiceBusErrors

クリティカルMQL:

ServiceBusErrors[1m].mean() > 0
なし >0 特定のコンパートメント内のService Busのクリティカル・アラーム。5分を超えるOSBサービスにエラーがある場合にレポートされます。

Microsoft IIS

  • リソース・タイプ: IIS

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: microsoft_iis

評価期間 アラームTule 警告 クリティカル 内容
1

IISダウン

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()

なし なし IISに接続できなくなったクリティカル・アラーム
5

ASP.Netワーカー・プロセス再起動

メトリック名: ASPDotNetWorkerProcessRestarts

クリティカルMQL:

ASPDotNetWorkerProcessRestarts[1m].mean() > 1
>1 なし ワーカー・プロセス再起動があったかどうかを確認するためのクリティカル・アラーム。これは、パフォーマンスへの影響や情報の損失など、多くのことが原因で発生する可能性があります。
5

ASP.Netキューに入っているリクエスト

メトリック名: ASPDotNetRequests.Type.Queued

警告MQL:

ASPDotNetRequests.Type.Queued[1m].mean() > 5

クリティカルMQL:

ASPDotNetRequests.Type.Queued[1m].mean() > 10
>5 >10 着信HTTPリクエストがロードのためにキューに入れられているかどうかを知らせるクリティカル/警告しきい値。
5

ASP.Netエラー率

メトリック名: ErrorRate

警告MQL:

ErrorRate[1m].mean() > 1%*

クリティカルMQL:

ErrorRate[1m].mean() > 2%*
> 1%* > 2%* ASP.Netアプリケーションのエラー率が特定のしきい値を超えていることをユーザーに警告するクリティカル/警告しきい値。このメトリックはエラー/秒で戻されるため、取得した平均合計リクエストに基づいてしきい値を設定する必要があります。たとえば、通常100リクエスト/秒を取得する場合、警告の場合は1エラー、クリティカルの場合は2エラーを推奨します。
  • リソース・タイプ: IIS Webサイト

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: microsoft_iis

評価期間(分) アラーム・ルール 警告 クリティカル 内容
1

IIS Webサイト・ダウン

メトリック名: MonitoringStatus

クリティカルMQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
なし なし IIS Webサイトに接続できなくなったクリティカルアラーム
5

WWW現行接続

メトリック名: CurrentConnections.Service.WWW

警告MQL:

CurrentConnections.Service.WWW[1m].mean() > 90%*

クリティカルMQL:

CurrentConnections.Service.WWW[1m].mean() > 95%*
> 90%* > 95%* 接続数が最大に近づいていることをユーザーに警告するクリティカル/警告しきい値。顧客は、最大接続の90 / 95%に番号を設定する必要があります。このメトリックは数値であるため、設定されるこのアラートは各顧客に一意になります。たとえば、ユーザーに合計200個の接続が許可されている場合、警告として180個、クリティカルとして190個をお薦めします。

NGINX

  • リソース・タイプ: NGINX

  • メトリック・ネームスペース: oracle_appmgmt

  • リソース・グループ: nginx

評価期間 アラーム・ルール 警告 クリティカル 内容
3

Nginx Down

表示名: MonitoringStatus

MQL:

MonitoringStatus[3m].mean() != 1 ||MonitoringStatus[1m].absent()

なし 0

NGINX APIエンドポイントに接続できないアラーム。

5

再生成されたプロセス率

メトリック名: RespawnedProcessesRate

警告MQL:

RespawnedProcessesRate[5m].mean() > 1

クリティカルMQL:

RespawnedProcessesRate[5m].mean() > 2

>1 >2

間隔中に再生成されたプロセスの数。

5

HTTPアップストリーム・ヘルス・チェックの異常率

メトリック名: HttpUpstreamsHealthChecksRate

ディメンション名: Type

ディメンション値: Unhealthy

警告MQL:

HttpUpstreamsHealthChecksRate[5m]{Type = "Unhealthy"}.mean() > 1

>1 なし

NGINXによって検出された異常な状態。パフォーマンスや可用性に悪影響を及ぼす可能性があります。

5

Stream Upstreamsのヘルス・チェックは、NGINXのパフォーマンスまたは可用性で検出された異常な状態が1を超えると評価されます

メトリック名:

StreamUpstreamsHealthChecksRate

ディメンション名: Type

ディメンション値: Unhealthy

警告MQL:

StreamUpstreamsHealthChecksRate[5m] {Type = "Unhealthy"}.mean() > 1

>1 なし

NGINXで異常な状態が検出され、パフォーマンスや可用性に悪影響を及ぼす可能性があります

メトリック拡張

メトリック拡張のメトリック値がしきい値を超えた場合にアラームをトリガーするアラーム・ルールを作成できます。リソースの組込みメトリックのアラーム・ルールを作成するのと同じ一般的なワークフローを使用します。主な違いは、「メトリックの説明」セクションにあります。

  • コンパートメント: メトリック拡張が有効化されたリソースのコンパートメントを選択します
  • メトリック・ネームスペース: oracle_metric_extensions_appmgmtを選択します
  • リソース・グループ: メトリック拡張がデプロイされたリソースのリソース・タイプ。

次のイメージに、ホストのメトリック拡張に対するアラーム・ルールの作成を示します:


メトリック拡張のアラーム・ルールの作成

この記事は役に立ちましたか。