エンタープライズのステータスとパフォーマンスのモニター
アプリケーション・スタックのヘルスおよびパフォーマンスを監視することは、すべてのDevOpsおよびIT Opsジョブの重要な部分です。アプリケーション・スタックの各コンポーネントは、リソースと呼ばれます。スタック・モニタリングを使用すると、アプリケーション・スタックを構成するリソースの可用性ステータスおよびパフォーマンスを監視し、OCI Monitoringを使用して、いずれかのリソースが停止したときまたはパフォーマンスしきい値を超えた場合にアラームを設定できます。
お客様の企業の可用性とパフォーマンスを監視するための標準的なワークフロー
タスク | 内容 | 詳細情報 |
---|---|---|
1. エンタープライズ全体で、または管理する層内で、停止しているリソースがあるかどうかを確認します。 | ダウンしている、または可用性の問題が発生しているリソースの特定と調査 | モニター可用性ステータス |
2. オープン・アラームを調査します。 | 未解決のアラームの詳細を確認します。 | オープン・アラームの調査 |
3. 管理している層内のパフォーマンス問題を特定および分析する。 | 各層内で、潜在的なパフォーマンス問題があるエンティティを特定します。 | 管理している層内のパフォーマンス問題の特定および分析 |
4. エンタープライズ・サマリーの層をカスタマイズします。 | エンタープライズ・サマリーの各層に表示されるリソース・タイプおよびメトリックの変更 | エンタープライズ・サマリー層のカスタマイズ |
5. リソースの全体的なヘルスを確認します。 | リソースの現在のパフォーマンスの確認 | リソース・ホームページのリソース・ヘルスのモニター |
モニター可用性ステータス 🔗
アプリケーション、アプリケーション・サーバー、データベースおよびその他のリソースを担当する管理者は、ユーザーに影響を与える前に問題を検出して解決できるように、その可用性ステータスを常に監視します。スタック・モニタリングには、モニター対象のすべてのリソースの現在の可用性が一目でわかる「エンタープライズ・サマリー」ページが用意されています。
可用性ステータス監視
-
可用性ステータスは検出時に自動的に監視されます。
-
リソースが停止している場合は、クリティカル重大度のアラームを生成するアラーム・ルールを作成できます。
-
リソースが稼働中であることが検出されると、アラームは自動的にクリアされます。
すべてのアプリケーション・リソースで現在の可用性ステータスを監視するには:
-
「エンタープライズ・サマリー」ページにナビゲートし、「ステータス」サマリー・リージョンで、すべてのリソースの現在の可用性ステータスを確認します。
「ステータス・サマリー」リージョンには、各リソースの状態が示されます。
-
Up
: リソースは正常に稼働しており、メトリックも正常に収集されています。 -
Down
: リソースはダウンしており、実行中の状態ではありません。 Not reporting
: リソースは、過去10分間、そのMonitoringStatusメトリックのデータをレポートしていません。管理エージェントが停止しているか、Oracle Cloudと通信できない可能性があります。
-
-
通常、最初に
Down
またはNot reporting
ステータスを示すリソースに焦点を当てます。Down
またはNot reporting
ラベルにドリルダウンし、このステータスを持つすべてのリソースに注目します。リストを縮小するには、リソースのリストをタイプ別にさらにフィルタします。 -
Down
またはNot reporting
ステータスの各リソースについて、リソース・ホーム・ページにドリルダウンして詳細を確認します。ホーム・ページの「アラーム」セクションで、特にモニタリング・ステータス・アラーム・メッセージを確認します。問題が解決すると、アラームが自動的にクリアされます。
アラームを生成し、リソースが停止したときに通知を送信するようにアラーム・ルールを設定するには、アラームの設定を参照してください。
リソースがレポートなしステータスの場合
リソースのステータスが「レポートなし」の場合、これは、過去5分間、リソースのMonitoringStatusメトリックに使用可能なデータがないことを意味します。これは、リソースを監視している管理エージェントの問題が原因である可能性があります。管理エージェント自体が停止しているか、Oracle Cloudとの通信に問題があるか、メトリックを格納するための十分なディスク領域がない可能性があります。
トラブルシューティングするには、「レポートなし」ステータスのリソースのホームページに移動します。リソース・ホームページで、「プロパティ」リージョンを確認します。このリージョンでエージェント・ステータスを見つけて確認します。
「エージェント・ステータス」が「稼働中」(または「アクティブ」)でない場合は、リソースのモニタリングに影響し、リソースが「レポートなし」ステータスになります。その後、エージェントの問題を解決する必要があります。関連付けられたエージェントを検索するには、「エージェント・ステータス」に関連付けられた値をクリックするか(前のイメージに示すように「サイレント」をクリックするか)、「関連リソース」リンクをクリックするか、表示される「関連リソース」表でエージェントを検索してクリックします。

どちらの方法でも、エージェント・ホームページに移動し、新しいブラウザ・タブで開いて、エージェントのステータスをさらに調査および解決できます。

各リソース・タイプ内の可用性ステータスのモニター 🔗
様々なリソース・タイプを担当する管理者については、「エンタープライズ・サマリー」ページに、そのタイプのすべてのリソースの現在のステータスを示す各リソース・タイプのリージョンが表示されます。層状のステータス棒グラフは、企業で監視している各層内のリソース・タイプのステータスの内訳を示します。
各層内の現在の可用性ステータスの監視 🔗
各層内の現在の可用性ステータスを監視するには:
- 「エンタープライズ・サマリー」ページにナビゲートし、「リソース・タイプ別のステータス」リージョンを見つけます。
- これらのステータス棒グラフは、そのリソース・タイプ内で企業でモニターされている各リソース・タイプまたは層のステータスの内訳を示します。
- 特定のステータスのリソースのみを表示するには、ステータス・アイコン(「上へ」、「下へ」、「レポートなし」)のいずれかをクリックして、そのステータスのリソースのみを表示します。たとえば、次の図に示すように、「下へ」をクリックします。
「下へ」をクリックすると、次のものが表示されます:
停止している特定のリソースの詳細を表示するには、いずれかの棒グラフをクリックします。
調査対象のリソース・タイプ内で実施するタスクの例を示します。
-
「Up」以外のステータスのリソースにドリルダウンします。
-
「稼働中」ステータスを持たないリソースに関連するリソースを識別します。たとえば、停止しているWebLogicサーバーを見つけます。
-
問題があると判断した各リソースのホーム・ページを確認します。リソースのアラームを探します。「関連リソース」ページを参照して、関連リソースのステータスを確認することもできます。
オープン・アラームの調査 🔗
管理者は、オープン・アラームを定期的に事前に確認できます。
「エンタープライズ・サマリー」ページからアラームを調査するための一般的なワークフローを次に示します。
-
「Enterprise Summary」ページで、「Alarms」リージョンを見つけます。このリージョンには、オープン・アラームの合計数と、重大度別のこれらのアラームの内訳が表示されます。
- アラームの合計数(または重大度ごとの各数)をクリックすると、これらのアラームのリストを示すパネルが表示されます。
- 「アラーム」パネルで、いずれかのアラームをクリックして、「OCIモニタリング」ページでその特定のアラームの詳細を示す新しいブラウザ・タブを開きます。
管理している層内のパフォーマンス問題の特定および分析 🔗
インフラストラクチャの様々な層に責任を負う管理者のために、「エンタープライズ・サマリー」ページには、その層内のすべてのリソースの現在のパフォーマンスを監視できる層のリージョンが用意されています。
「エンタープライズ・サマリー」ページの上部には、すべてのリソースに適用されるロールアップ情報(リソースの合計数、リソース・ステータスの内訳、すべてのリソースに対してトリガーされるすべてのアラームの内訳)が表示されます。この下にあるグラフィカル・インタフェースでは、エンティティが層ごとにグループ化され、各層のパフォーマンス情報がロールアップされています。
「エンタープライズ・サマリー」ページに移動して、目的の層のパフォーマンス・メトリックのチャートを見つけます。パフォーマンス・チャートで、外れ値を調べます(他と比較して異なるように見え、孤立しているチャートをポイントします)。このポイントの上にカーソルを置くと、そのポイントのリソース名とメトリックの値を確認できます。

散布図チャート内の各データ・ポイントまたは表内の各ライン・アイテムは、1つのリソース・インスタンス(1つのデータベース、1つのWebLogicサーバーなど)を表します。ただし、メトリックにディメンションがある場合、同じリソース・インスタンスに関連付けられたそのメトリックに複数のデータ・ポイントが存在する可能性があります。
これらのシナリオでは、次の表に、表示されるメトリック・データ・ポイントの詳細を示します。様々なディメンションにわたるこれらの複数のデータ・ポイントが集計されるか、ディメンション全体にわたる特定のメトリック・データ・ポイントが選択されます。
メトリック単位 | 表示値 | Description | 例 |
---|---|---|---|
パーセント(使用率) | すべてのディメンションで最大値 |
単位としてパーセントを使用するメトリック(ファイル・システム使用率などの使用率メトリックなど)では、使用率の最大値(パーセント)を示すディメンションが使用されます。 これにより、管理者は最も使用率の高いリソースに集中できます。 |
メトリック名: FilesystemUtilization ディメンション: fileSystemName 表示されるディメンション値: リソースに対して最も使用されているファイルシステムの割合。 たとえば、ホストにfilesystemメトリックの次の値がある場合:
チャートにはホストの95%が表示されます。 |
デフォルト(その他すべて) | ディメンション全体の合計 |
「Disk Activity Summary」では、すべてのディスク操作/秒の合計が合計されます。 これにより、管理者は最もビジーなリソースに集中できます。 |
メトリック名: DiskActivitySummary ディメンション: diskName 表示された値: すべてのdiskNamesに対する読取りおよび書込み操作のレートの合計。 前述の例で、ホストに次のメトリック値がある場合:
チャートには、そのホストについて、1650 ops/secの値がすべてのディスクの合計で表示されます。 特別なユースケース 様々なデータ・ポイントが選択される特殊なシナリオを次に示します。
|
パフォーマンス問題の動的なトラブルシューティング
メトリック・チャートにより、対話型の問題の識別および分析が簡略化されます。
- UIの右上隅にある「パフォーマンス・メトリック期間」コントロールを使用して、チャートの期間を変更します。
-
メトリックをさらにレビューするには、チャート上の点をクリックしてリソース・ホームページまでドリルダウンします。
-
分散チャートに表示するメトリックを変更し、他の2つのメトリックの集約的なパフォーマンスを確認します。各チャートに表示されるメトリックを変更するには、チャートの右上隅にある「編集」アイコンをクリックします。

メトリックを変更できる「編集」パネルが表示されます。

スタック・モニタリングのすべてのメトリックは、oracle_appmgmtまたはoracle_oci_databaseネームスペースの一部です。
メトリックのディメンションを指定してメトリックをさらに修飾する場合は、「拡張」オプションを使用して、次に示すようにメトリックのディメンションの選択を有効にします。

パネルの下部にある「適用」をクリックして、変更を保存します。「適用」に加えて、元のメトリック・チャートをリストアする「デフォルトのリストア」オプションもあります。
表示するパフォーマンス・チャートを切り替えます。たとえば、監視されているすべてのホストの「CPU使用率%」および「メモリー使用率%」が表示されます。この時点で、次を実行できます。
-
このチャートで外れ値を確認し、「CPU Utilization %」または「Memory Utilization %」(あるいはその両方)の高い値を探します。これらのホストには現在高い負荷がかかっている可能性があります。
-
データ・ポイント上にマウスを重荷を負っているホストを特定します。
-
データ・ポイントをクリックし、これらのメトリックのトレンドを調査して、ホストにどのくらいの期間高いロードがあったかを確認します。長期的なトレンドは、さらなる調査を必要とするホストの問題を示唆する可能性があります。
追加のパフォーマンス・チャートの管理
パフォーマンス・チャートでマウスのスクロール・ホイールを使用して、イメージの中心を同じままにズーム・インまたはズーム・アウトできます。
マウスの左ボタンをクリックすると、ズーム・インするデータ領域を選択できます。マウス・ボタンを離すと、選択した領域が画面の中央に表示され、チャートの全領域を埋めるように自動的にズーム・インします。
x軸とy軸の範囲もスライドさせることができます。調査に適したポイントの集中が見つかるまで、マウスの左ボタンを押したままx軸の左右方向またはy軸の上下方向に移動します。
エンタープライズ・サマリー層のカスタマイズ 🔗
デフォルトでは、エンタープライズ・サマリーには4つの層があり、各層にはその層の主要なパフォーマンス・メトリックが含まれています。
- E-Business Suite
- WebLogicサーバー
- Oracle Database
- ホスト
環境に基づいて、これらの層の1つまたは2つを変更して、関心のある特定のリソースに集中できます。
たとえば、環境内でOracle E-Business Suiteを実行していない可能性があるため、第1層の「E-Business Suite」のチャートは空になります。この層を使用して、関心のある他のリソース・タイプのメトリックを表示できます。
これを行うには、層を展開し、最初のチャートの「編集」アイコンをクリックします。

これにより、右側の「編集」パネルが開き、メトリック・チャートのデフォルト設定が表示されます。

上部の「チャート」セクションを展開し、「階層」名、チャートの「タイトル」およびメトリックを変更します。次の例では、「層」がWebLogicサーバーに変更され、チャートのタイトルが「JDBC接続」に変更され、それに応じてメトリックも変更されています。

「編集」パネルの下部にある「適用」をクリックすると、階層およびチャートに変更が表示されます。

層内の残りのチャートは引き続き変更できます。
カスタマイズに関するその他の考慮事項:
- ブラウザをincognitoモードで起動しないでください。
- チャートに対する変更は、セッション中および使用されている特定のブラウザに対して保持されます。
- セッション間で変更を保持する場合(セッションのログイン/ログアウト後など)は、ページの左下にある「デフォルトとして保存」をクリックします。変更がブラウザに保存されます。元のエンタープライズ・サマリー・チャート設定をリストアする場合は、「デフォルトのリストア」をクリックします。特定のユーザーのブラウザ用にリストアされます。
- メトリック拡張をチャートに追加するには、チャートの「編集」アイコンをクリックします。次に、メトリック拡張が有効になっているリソースの
Namespace = oracle_metric_extensions_appmgmt
およびリソース・タイプを選択します。次に、メトリック拡張の適切なメトリックを選択します。

リソース・ホームページのリソース・ヘルスのモニター 🔗
リソースを予防的に監視することで、ユーザーに影響する前に潜在的な問題を特定して解決できます。
スタック・モニタリング・リソースのホーム・ページでは、リソースの状態をプロアクティブに監視できます。可用性ステータスからオープン・アラーム、キー・パフォーマンス・インジケータまで、すべてのリソース関連情報の概要が表示されます。通常、リソース・ホーム・ページには、次のような様々な方法でアクセスできます。
- 「エンタープライズ・サマリー」ページの「ステータス」リージョンでリソース・ステータスをトラブルシューティングする場合: 任意のステータスをクリックすると、そのステータスを持つすべてのリソースのリストが絞り込まれます。リストをさらにフィルタし、リソース名をクリックして、そのリソース・ホーム・ページにアクセスします。
- 「エンタープライズ・サマリー」リソース・タイプ・リージョンからのステータスの確認: そのリージョン内の任意の棒グラフをクリックすると、そのタイプおよびステータスのすべてのリソースのリストが絞り込まれます。次にリソース名をクリックすると、そのリソース・ホーム・ページにアクセスできます。
- 「Enterprise Summary」ページの「Resources」リージョンですべてのエンティティを探索しています。リソースの数にドリルダウンすると、「All Resources」ページが表示され、さらにリストにフィルタを適用して特定のリソース・ホーム・ページにアクセスできます。
リソース・ホームページの探索 🔗
「リソース・ホーム」ページには、リソースの全体的なヘルスの評価を可能にするすべての情報があります。
「アクション」ドロップダウン・メニューから、UIビューをクラシック・ビューに戻すことができます。
「詳細」セクション
- 「プロパティ」には、リソースに関する情報が表示されます。
- 「関連リソース」には、関連リソースのステータスのサマリーが表示されます。関連リソースのトポロジの詳細を表示するには、関連リソースの数をクリックするか、左側のメニューから「トポロジ」をクリックします。
- 「アラーム」には、リソースに対するトリガーされたアラームの総数、および「クリティカル」、「警告」または「エラー」ステータスでトリガーされたアラームの数がそれぞれ表示されます。アラームの詳細を表示するには、カウントをクリックするか、左側のメニューから「アラーム」をクリックします。
- キー・メトリック・カードは、リソース・タイプごとに4つの事前構成済メトリックを示しています。メトリック・カードは、平均メトリック・データの他に、選択したメトリック期間中にメトリックで検出された場合、アラームおよび異常も示します。「メトリック履歴」パネルを表示するには、キー・メトリック・カードの値をクリックします。
「パフォーマンス」セクション
「パフォーマンス」セクションには、「キー・メトリック」、「すべてのメトリック」および「スタック・ビュー」の3つのタブがあります。
スタック・ビューは、E-Business SuiteやPeopleSoftなどのコンポジット・タイプのリソースに対してのみ表示され、スタック全体に関する包括的なインサイトが提供されます。スタック・ビューでは、EBSまたはPSFTアプリケーションの主要リソースの最も重要なメトリックをすばやく確認できます。コンポジット・リソースの子に関連付けられたホストがある場合、ユーザーはPSFTまたはEBSのスタック・ビューの下にあるすべてのホストのメトリックを表示できます。
現在の「可用性」ステータスには、時間の経過とともにリソースの可用性が表示されます。カーソルを可用性タイムラインに沿って移動すると、エンティティのキー・パフォーマンス・メトリック・チャートに対応する時間が表示されます。値をクリックすると、メトリック履歴が表示されます。デフォルトでは、過去60分間のデータが表示され、長期間に変更してメトリックのトレンドを経時的に確認できます。
「キー・メトリック」タブでメトリックを構成するには、右上隅から「チャートの構成」をクリックして、「パフォーマンス・キー・メトリックのカスタマイズ」ウィンドウを開きます。「パフォーマンス・キー・メトリックのカスタマイズ」ウィンドウから、「使用可能なメトリック」タブからメトリックを追加し、「選択したメトリック」タブからメトリックを削除し、「選択したメトリック」タブの右側からメトリックをドラッグしてメトリックの順序を変更します。
「すべてのメトリック」タブから、検索バーでは任意のメトリックに迅速にアクセスでき、任意の値をクリックすると、それぞれのメトリックの「メトリック履歴」パネルが開きます。
ベースラインと異常 🔗
ベースラインおよび異常検出 🔗
ベースラインは、リソースの標準パフォーマンスを表し、以前のパフォーマンスと現在のパフォーマンスを比較できます。これは、パフォーマンス・メトリックの適切なしきい値の設定に役立ちます。ベースラインは、パフォーマンス・メトリック値を一定期間観測して、このデータ・セットに機械学習アルゴリズムを適用することで計算されます。一定期間のパフォーマンス・メトリックを収集することで、スタック・モニタリングは、特定のメトリックについて通常予想される値の範囲を識別して、その範囲をベースラインとして保存します。標準範囲から外れたメトリックの値は、異常値として識別され、パフォーマンス・チャートに強調表示されます。システムが使用されるため、ベースラインは時間の経過とともにより微調整されます。
リソースのベースラインを有効にするには、ライセンスUIからそのリソースでStack Monitoring Enterprise Editionを有効にします。新しく検出されたリソースの場合、ベースラインは検出後少なくとも2時間後に有効になります。
ベースライン有効メトリックは、+で識別されます。マルチディメンション・メトリックの場合は、次の図に示すように、行の上にカーソルを置き、値のベースライン範囲と比較したメトリック値を理解します。

ベースラインと異常の構成 🔗
異常検出は、即時利用可能なリソース・タイプの一部の選択メトリックでデフォルトで有効になっています。ただし、異常検出は、UIで追加のメトリックおよびカスタム・リソースで手動で有効にできます。
メトリックのベースラインの有効化
- 「モニタリング設定」の下にある「ベースラインおよび異常」にナビゲートし、「メトリックのベースラインの有効化」を選択します。
- 「メトリックのベースラインの有効化」ページで、選択したメトリックのメトリック「ネームスペース」および「リソース・タイプ」(特定のネームスペースではオプションにできます)を選択して、異常検出を有効にします。「メトリックの選択」をクリックします。
- 「メトリックの選択」:スライドアウトには、選択したリソース・タイプで使用可能なメトリックのリストが含まれています。即時利用可能な選択メトリックに加えて、コンパートメントごとにネームスペース/リソース・グループごとに5つの追加メトリックを構成できます。必要なメトリックを選択し、「選択したメトリックの追加」をクリックして異常検出を有効にします。「選択したメトリックの追加」では、「ベースラインの有効化」パネルに戻り、「続行」をクリックするとステータス・ページが表示されます。有効化ジョブが完了するまで、ページに留まることをお薦めします。
メトリックのベースラインの無効化
ユーザー定義ベースラインを無効にするには、「ベースラインおよび異常」にナビゲートし、無効にするメトリックを見つけます。メトリックからベースラインおよび異常を削除するには、「アクション」列の「無効化」をクリックします。
フィルタを活用して、ベースラインを使用したユーザー定義メトリックの特定を容易にします。
E-Business Suiteの健全性の監視 🔗
E-Business Suiteホームページの使用
E-Business Suite (EBS)ホームページを使用して、EBSアプリケーションの全体的なヒースをモニターできます。
初期ビューには、EBSアプリケーションのメンバーの現在の可用性ステータスと、OracleデータベースやWebLogicサーバーなどのその他の関連リソースが表示されます。開いているアラームのサマリーとリストも表示されます。

開いているアラームをドリルダウンして、新しいブラウザ・タブでアラーム・ページを開くことができます。ここから、アラーム内のメトリックをさらに調査および確認できます。

「チャート」ページを使用して、アプリケーション、アクティブ・ユーザー・セッション、アプリケーションからの競合リクエストおよび実行済プログラムの実行時間ごとにアクティブ・リクエストを追跡できます。時間コントロールとタイム・スライダを使用して、任意の期間にフォーカスできます。

EBSスタック・ビュー
「スタック・ビュー」ページでは、EBSおよびこれらのスタック・コンポーネント全体の主要なパフォーマンス・メトリックを表示することで、EBSシステム、そのコンポーネントおよび基礎となるスタック(WebLogicサーバー、Oracle Database)の全体的な状態を迅速に監視できます。
最初に、EBSプログラムの平均実行時間と最大実行時間を確認して、予想される時間枠内で実行されていることを確認できます。予想以上に時間がかかるプログラムには、さらなる調査が必要になる場合があります。実行にかかる時間が最も長いプログラムを理解することは、将来スケジュールを立てるのに最適なタイミングでの計画にも役立ちます。
コンカレント・マネージャ・コンカレント完了要求を使用すると、選択した期間中に完了したすべてのコンカレント要求の全体的なステータスをモニターできます。チャートには、完了したリクエストのステータス別(正常に実行されたか、エラーがあったか、警告があったか)が表示されます。「長時間アクティブ・コンカレント要求」グラフには、経過時間が最も長いコンカレント要求が表示されます。これらのリクエストに関連付けられているプログラムとそれに対応する経過時間を確認し、それらのいずれかが予想よりも長くかかっているかどうかを確認できます。

関連するWebLogicクラスタ・oacoreからのJVMヒープ・メトリックは、EBSアプリケーションの実行に必要なJVMヒープのモニターに役立ちます。
JVMヒープ使用率の高い値が期待される場合がありますが、通常、ヒープ使用率のヘッドルームでアクティビティ内のスパートを可能にする必要があります。
ヒープ使用量(GB)を使用すると、より具体的なヒープ使用量の値を取得できます。最大値に近い絶えず高いトレンド線は、ヒープ・サイズを拡張する必要性を示す場合があります。
JDBC接続スループットのメトリック・チャートを使用すると、データベースへのJDBC接続の全体的な使用状況、成功または失敗を追跡できます。JDBC接続は、オープンJDBC接続のトレンドを示します。接続が使用および解放されると、値が変動する可能性があります。常に増加するトレンド線とJDBC接続スループットの値の増加- FailurestoReconnectは、割り当てられた接続で最大化できることを示している可能性があります。
最後に、データベース・チャートにより、EBSで使用されるデータベースのパフォーマンスをすばやく確認できます。DB時間(CPU時間+待機時間)のトレンドを確認できます。これは、ユーザー・セッションがデータベース・コードの実行に費やす時間、および待機クラス別の「待機時間」チャートに対応する時間を表します。
EBSスタック間での簡単なナビゲーション
EBSホームページで、「メンバー」ページを使用して、EBSコンポーネントの可用性ステータスをすばやく確認し、これらのEBSコンポーネントのホームページにドリルダウンできます。

「関連リソース」ページを使用して、EBSで使用される基礎となるWebLogicドメインおよびOracleデータベースのホームページにすばやくアクセスできます。
